MORIN - Library and Archives Canada · 2004-11-29 · Un examen des dossiers médicaux adultes à...
Transcript of MORIN - Library and Archives Canada · 2004-11-29 · Un examen des dossiers médicaux adultes à...
JACQUES MORIN
VALIDA~ON DE L'ÉCHELLE "APPROPRIATENESS EVALUATION PROTOCOL (mP)" EN GERIATRIE ET DANS LES DISCIPLINES MÉDICALES
Mémoire présenté
à la Facultb des 6tudes supérieures de iZTniversit6 Laval
pour l'obtention du grade de maître ès sciences (M.Sc.)
Département de médecine sociale et prbventive FACW DE MÉDECINE
UNIVERSITI? LAVAL
O Jacques Morin, 1999
National Library 1+1 ofCanada Bibliièque nationale du Canada
Acquisitions and Acquisitions et Bibliographie Senices services bibliographiques
395 Wellington Street 395, rue Wellingtari OttawaON KlAONI OttawaON KlAûN4 Canada Canada
Yourfih V 0 V s r d t i ~
Our Ns Norn ré&bnœ
The author has granted a non- exclusive Licence ailowing the National Lîbrafy of Canada to reproduce, loan, distribute or seU copies of thïs thesis in microform, paper or electronic formats.
The author retains ownership of the copyright in this thesis. Neither the thesis nor substantiai extracts fiom it may be printed or otherwise reproduced without the author's permission.
L'auteur a accordé une licence non exclusive permettant à la Bibliothèque nationale du Canada de reproduire, prêter, distribuer ou vendre des copies de cette thèse sous la fome de microfiche/nlm, de reproduction sur papier ou sur format électronique.
L'auteur conserve la propriété du droit d'auteur qui protège cette thèse. Ni la thèse ni des extraits substantiels de celle-ci ne doivent être imprimés ou autrement reproduits sans son autorisation.
L'"Approprïatenness Evaluation Protocol (m)" est une procédure systématisée de mesure de
la pertinence des admissions en courte durée qui s'appuie sur 16 critères explicites qui
réferent aux services médicaux reçus, aux services infirmiers et à l'état clinique du malade.
Nous avons déterminé la validité de cette échelle dam une étude rétrospective en comparant
les résultats de I'AEP au jugement par consensus de trois cliniciens experts auprès d'une
population admise dans les départements de médecine et de gériatrie dans Ie Centre
hospitalier afllié universitaire de Québec (CHA). La senii'bilité de l'AEP en médecine ou sa
capacité à mesurer les admissions non p h e n t e s était de 100%. sa spkincité de 95%, ses
valeurs prédictives négatives et positives étaient respectivement de 100% et 64% pour un
coefficient d'accord Kappa de Cohen de 75%. En gtnatrie, la sensibilité de l'AH? fÙt de
62%, sa spécificité de 77%, sa valeur prédictive positive de 16% et négative de 97% pour un
coefficient d'accord Kappa de Cohen de OJ6. En conclusion, l'échelle AEP s'est avérée un
instrument non valide pour mesurer la pertinence des admissions en gériatrie, mais valide
pour les autres discipluies médicales.
Jacques Morin Auteur
Pierre J. Durand Directeur
André Tourigny Co-directeur
AVANT-PROPOS
J'ai été initié au monde de l'évaluation de l'utilisation des ressources hospitalières il y a
environ deux ans suite à une visite du virifcateur général du Québec. C'est dans le cadre
d'une tournée provinciale que notre hôpital a été évalué quant à sa performance en regard de
la pertinence des admissions et de la durée des séjours. J'ai compris a ce moment 1à que
l'évaluation de la qualité des soins n'était plus un domaine strictement réservé aux médecins
et qu'à l'avenir, nous aurions à répondre de nos activités.
Après quelques discussions avec les docteurs André ToUngny et Pierre J. Durand qui
oeuvrent tous deux dans le domaine de l'évaluation des services de santé, nous avons
convenu de construire ce projet de recherche.
La réalisation des différentes étapes conduisant à l'atteinte des objectifs que nous nous étions
fixés, a nécessité la participation de nombreux coiiaborateurs que je tiens a remercier. En
premier lieu, les docteurs Andr6 Tourigny and Pierre Durand qui m'ont supervisé au cours de
toutes les étapes du projet. Je tiens à remercier également les docteurs Hélène Shard,
Michèle Morin et Maurice St-Laurent qui m'ont accordé leur temps précieux à titre d'expert
clinicien. Je salue également la disponibilité de madame Hélène Brûlé du service des
archives du CHA de même que madame Line Beauchesne, monsieur Louis Rochette et
madame Claire Lamontagne de l'Unité de recherche en gériatrie pour leur aide précieuse dans
la préparation de ce document.
Enfin, je remercie la direction de la recherche du CHA par voie de financement FRSQ et la
Chaire de gériatrie de l'Université Laval pour les subventions qu'elles m'ont accordées sans
quoi il m'aurait ét6 impossible de réaliser le projet.
TABLE DES MATLÈRES
OBJECTIF DE L'ÉTUDE ................................................,.........o-...- .................................... 15
LES RÉSULTATS .....................a. ......~.~~.~...~.......~~.~......~..~.......~.s~..s.osoo..~t.....o.~s.oo..~.....o...~...~~28
LISTE DES TABLEAUX
TABLEAU 1 : Comparaison quant aux caract6ristiques de la population cible et de l'échantillon aléatoire en gériatrie et dans les
0 . . I discipiines medicales ..............................................................
TABLEAU II : Fiabilité intembserbateur des trois cIiniciens experts selon leur jugement implicite de la pertinence des admissions en gériatrie et en médecine E,: réviseur 1, &: réviseur 2, E;:
...................................................................... r6viseur 3.0C.......
TABLEAU lïI : Résultats de la conférence consensus et de L'opinion des cliniciens experts quant à la pertinence ou non des admissions en gériatrie et dans les disciplines médical es......
TABLEAU IV : Répartition des cas divergents paxni les dossiers révisés par . - 0 . les trois cliiuc~ens experts .......................................................
TABLEAU V : Répartition des dossiers divergents selon l'évaluateur E, vs E, vs E, en gériatrie, dans les disciplines médicales et au total .......................................................................................
TABLEAU VI a) Validité de l'échelle AEP en comparaison du consensus des trois cliniciens experts en gériatrie ......................................-..
TABLEAU VI b) Validité de l'échelle AEP en comparaison du consensus des trois clùliciens experts en médecine*.. .............................*......
TABLEAU W Raisons d'admissions non pertinentes ........ ... .....................
Page
41
LISTE DES FIGURES
PAGE
FIGURE 1 Relation entre les besoins pour des senices hospitaliers et les services reçus .......................... .., .............................................. 49
FIGURE 2 Relation entre les coûts hospitaliers, la quantité de services , reçus et les benefices pour la santé ............................................... 50
FIGURE 3 Défition des ternes et description des résultats pour un sous échantillonnage prospectif selon KC. Kraemer.. ......... .... ........ 51
INTRODUCTION
Au cours des trente dernières années, le pourcentage du produit intérieur brut (PB) consacré
aux soins de santé au Canada est passé de S,4 % qu'il était en 1960 à 9,9 % en 1991[1]. Le
Québec a dépense près de 15 milliards de dollars en 19954996 pour les soins de santé, soit
10% de son PIB et 33 % de son budget. Les Centres hospitaliers de soins généraux et
spécialisés (CHSGS) ont utilisé 41% de ce budgetm. C'est à la fois pour diminuer l'importance
de ces dépensa et adapter la prestation de soins de santé aux nouvelles tendances observées
aillems que la transformation du résean de la santé a été entreprise en 1995-1996-
Pour relever ce défi, on doit trouver des façons nouvelles d'assurer la prestation des soins de
santé. L'une d'elles consiste à avoir recours à des modes de prestations et de traitement moins
coûteux dans un milieu de soins mieux indiqué. De façon générale, eues reflètent I'orientation
des changements qui sont sucvenus ces dernières années dans les politiques de santé des
provinces. Ces changements reposent sur les stratégies suivantes : réduction du nombre de lits
de soins actifk et de la durée des séjours à l'hôpital; remplacement des soins actifs par des soins
continus; réduction du taux d'actes chuurgicaux inutiles et augmentation des interventions
chuurgicales d'un jour en remplacement d'interventions pratiquées sur les malades hospitalisés;
réduction du placement en établissement des personnes âgées et remplacement des soins en
centre d'hébergement par des soins à domicile et des soins continus. 131
A l'image de la Province, la région de Québec a adopté un plan de transformation 1995-1998.
Au cours des deux premières années de ce plan triennid, le nombre total des hospitalisations a
diminué de 15%. Cette diminution est en partie attribuable au changement de mission de quatre
établissements de courte durée en longue durée et à la fermeture d'un autre. Une certaine
proportion des hospitalisations qui y avaient Lieu a été absorbée par les CHSGS restants
(CHUQ, CHA, H. Lavai), alors qu'une autre proportion a été traitée en ambulatoire. C'est ainsi
que si le nombre d'hospitalisations en chinugie et en médecine a diminué de 16% et 17% dans
La région, il a plutôt augmenté de 3% et 6% au CHA (Pavillons Enfant-Jésus et St-Sacrement)
puisqu'une bonne partie de la clientèle qui fEquentait les hôpitaux transformés s est dkigée.
Parallèlement à ces changements, les centres hospitaliers ont diminu6 leur nombre de Lits
utilisés pour des soins de courte durée en santé physique. En effet, ce nombre est passé de
2,354 en 19941995 à 1 760 en 1996-1997, soit L'équivalent d'un ratio de lits par 1 000 habitants
de 2,75 à 2,06 et une baisse de 25% [4]. Parallèlement, Ia clientèle âgée fréquentant les salies
d'urgence s'est accrue de sorte que Ie Pavillon Enfant-Jésus est, avec le Pavillon St-Sacrement,
celui qui reçoit le plus de patients sur civière, âgés de 75 ans et plus @lus de 3000 par année).
Cette clientèle est la plus susceptiïle d'être hospitalisée. Cette augmentation de la demande de
soins dans les CHSGS restants, combinée à une diminution importante du bassin de lits
disponibles, contribuent donc à exercer une pression plus forte qu'auparavant sur la décision du
clinicien d'hospitaliser ou non un patient.
Si certains indicateurs d'utilisation des services disponibles dans les grandes banques de
données (Med-Écho) comme la proportion de la chirurgie réalisée en ambulatoire permettent de
questionner la pertinence des admissions électives en chirurgie [SI, il existe peu d'indicateurs
valides permettant de faVe ie même questionnement avec les hospitalisations électives en
médecine, encore moins avec les hospitalisations dites urgentes. Les hospitalisations en
médecine regroupent pourtant la plus grande proportion des hospitalisations, soit 36 % contre
32 % en chirurgie. [6]
L'utilisation des DRG (Diagnosis Related Groups) pour juger de la performance hospitalière a
aussi été critiquée par plusieurs cliniciens et gestionnaires. En effet, la validité des données est
douteuse et la méthodologie ne permet pas de discriminer certains types de clientèles, en
particulier pour la population âgée oh la méthodologie n'est pas suEsamment ratFnée pour
permettre l'évaluation équitable d'une population fragilisée et hétérogène [7]. L'utilisation des
durées moyennes de séjour par DRG, comme seul marqueur de performance, peut amener des
effets pervers. Une durée de séjour réduite à d a seules fins de performance peut engendrer m e
augmentation des taux de réadmission et une augmentation de L'orientation en milieu
d'hébergement public et par conséquent, une baisse de la qualité des soins et un accroissement
des coûts.
Le rapport du vérificateur général du Québec (1997) adressé à la Régie &@onale de Québec[8]
renforce d'ailleurs des recommandations déjà émises en 1994 dans le cadre de la Conférence
des sous-ministres de la Santé des gouvernements fédérai, provincial et des territoires dans le
document "Faire mieux avec moins : pour une utilkation eficace des h6pitaux canadienr'l9].
En effet, le dernier rapport du Vérificateur reproche le manque de données dispo111Ibles pour
juger de l'efficacité du système de soins et insiste sur la mise en oeuvre d'études visant à évaluer
la pertinence d a hospitalisations dans les centres hospitaliers de courte durée.
D a études canadiennes révèlent que les hôpitaux de courte durée sont souvent utilisés de façon
non pertinente. Un examen des dossiers médicaux adultes à l'aide d'outils chiques, fondés sur
des critères explicites. a révélé que 18 a 48 % des admissions en courte durée étaient non
pertinentes et que de 19 à 60 % des jours d'hospitalisation seraient évitables[9441. Ces chïffks
sont comparables à ceux qu'on retrowe dans les études internationales, lesqueiles révèlent que
7 à 46 % des admissions sont non pertinentes[l5-40]. Plus récemment, certaines études se sont
penchées spéciiquement sur la population gériatrique et ont démontré des taux d'admissions
non pertinentes entre 13 et 29 % [41-431. Une étude italienne a cependant montré me
diminution de ces admissions non pertinentes de 32 % à 15 % entre 1988 et 1993 [43]. Au
Québec et particulièrement dans la région de Québec. aucune étude n'a été publiée sur ce sujet.
La revue de l'utilisation des ressources hospitalières peut se définir comme l'évaluation de la
pertinence et de l'efficience des soins hospitaliers par le biais de l'examen du dossier médical.
Il existe plusieurs stratégies afin d'améliorer l'utilisation des ressources hospitalières [9]. Parmi
celles-ci, il y a la revue des admissions et des d d e s de séjour[44l. L'état de chaque patient est
évalué à ['aide de critères chiques précis visant à déterminer la gravite de la maladie et les
soins nécessaires à son état. Les critères cliniques utilisés doivent être e n t é ~ é s par le
personnei médical et modifiés au besoin. Plusieurs instruments ont été développés au cours des
dernières années pour évaluer la pertinence des hospitalisations[45-501
Historiquement, la revue de L'utilisation des ressources était accomplie périodiquement par des
cliniciens à Saide de critères implicites- Dcwr chercheurs américains, PM.Gertman et J.D.
Restuccia, ont développé le "Appropriateness Evaluation Protocol (AEP)" basé sur des critères
explicites [45]. De ce dernier, sont issus d'autres outils dont les principaux sont L1SD-A[47,
481 (Intensity of sentice, sever@ of illness and dbcharge screens) et le M.C.AS.~naged
Care Appropriateness Protocol) [49]. Constmits à p h de critères ciiEïquesy ils sont utilisés
pour réviser de façon rétrospective ou prospective les dossiers de patients hospitalisés et ils
permettent d'identifier ceux qui respectent ou non ces critères. Le recours à de tels outils a aussi
l'avantage de questionner les raisons pour lesquelles une admission est jugée pertinente ou non
et de recommander les changements qui en découlent.
Comme les pressions sont très fortes pour mieux mesurer la performance des hôpitaux, il
devient prirno:&ai de savoir si les instruments développés ailleurs et souvent utilisés pour
d'autres clientèles seront utiles dans le contexte québécois et auprès d'une population ciblée à
risque comme les patients en médecine et en gériatrie. L'étude proposée ici a Wé à valider
1'Appropriatene.w Evaluation Protocol (AEP) dans le contexte québécois des sohs médicaux
en courte durée en portant une attention particuiière aux soins gériatriques. Cette étude
constituait une étape exploratoire (projet pilote) parce que cet instrument était employé pour la
première fois au Québec et que la valeur de FA.E.P. peut varier en fonction de dinérents
facteurs dont le système de santé dans lequel il est utilisé, la population étudiée et la présence
ou non de ressources alternatives a lliospitalisation.
Selon les résultats obtenus sur la validité de PUistnunent, i'étude permettra soit d'étendre son
application à d'autres établissements tant au niveau régional que prowicial, ou inciter à en
développer un qui réponde au contexte des soins gériatriques-du système de santé québécois.
La mesure de la pertinence des admissions pourra permettre d'engager un processus de
réflexion entre les cliniciens et les gestionnaires tant à l'intérieur de l'établissement qu'avec les
partenaires extra-hospitaliers afin de s'assurer de maximiser les ressources existantes en
déterminant les raisons des admissions non pertinentes de façon à apporter les correctifs
nécessaires. Pour les patients, les bénéfices d'une telle étude pourront être de diminuer les
risques iatrogènes liés à une hospitalisation non pertinente et de leur permettre d'avoir accès aux
meilleures alternatives au bon moment.
RECENSION DES E ~ T S
Concept et historique de In revue de L'utWsation des ressources
En raison de l'augmentation rapide du coût des soins de santé, on a assisté au cours des
dernières années à plusieurs rapports d'experts en économie de la santé sur les différentes
manières de les contenir [3 ,9,5 11. Ainsi, on a exerc6 beaucoup de pression, principalement sur
les hôpitaw de soins généraux et spécialisés (CEISGS), afin qu'ils réduisent leurs coûts et
augmentent leur productivité. Panni les approches favorisées, on retrouve la capitation 1521, le
financement basé sur les durées de séjour en relation avec le diagnostic (Diagnosis Related
Groups)[53] et la revue de i'utilisation des ressources (Utilliation review)[4S].
Conceptuellement, le but de la revue de l'utilisation des ressources est d'identifier et de réduire
l'utilisation non pertinente des ressources hospitalières tout en maintenant l'acce~~~'t,iiit~. il y a
deux types d'utilisation non pertinente. La surutilisation des soins survient lorsqu'un patient
reçoit des seMces qui ne lui donneront pas de bhéfices, soit parce qu'il est demeuré trop
longtemps à l'hôpital ou que les services qu'il a tgus auraient pu être donnés dans un autre
milieu moins cofiteux comme en milieu de réadaptation ou en ambulatoire. La sousutilisation
se définit comme des soins qui ne rencontrent pas les besoins d'un patient parce qu'il a été
libéré trop tôt de l'hôpital ou qu'il a eu en ambulatoire des soins qu'il aurait dû recevoir en
intra-hospitalier (figure 1).
Que ce soit la surutilisation ou la sousutilisation, les deux ont des impacts sur la qualité des
soins et leurs coûts. Cette relation peut être démontrée sous forme graphique (figure 2). Le
coût des services augmente avec La quantité de ceux-ci. Jusqu'à un certain point A, le patient
bénéficie d'une améiioration des effets sur sa santé avec la quantité de services. Entre les points
A et B, le patient ne bénéficie plus d'effets sur sa santé même si la quantité des services
augmente. Au delà du point B, la quantité d a services reçus peut occasionner des effets
néfastes sur sa santé. D'un point de vue économique, la revue de l'utilisation des ressources
consiste à ramener la quantité de services (ou les coûts) du point B au point A. D'un point de
vue clinique, le but est de réduire les interventions non pertinentes tout en maintenant
accessibles celles qui sont pertinentes.
Jusqu'à récemment aux États-unis, la plupart des incitatifs encourageaient la surutiù"sation des
services de santé. Les médecins et les hôpitaux étaient remboursés pour tous les services
rendus. Cependant, au cours des derniéries années, plusieurs pmgrammes mis en place ont
contrecarré cette tendance. En plus de la rwue de l'utilisation des ressources, on a mis sur pied
le MPPS "Medicare Prospective Puyment System'' afin de réduire la durée d'hospitalisation en
allouant un prix fixe pour chaque hospitalisation D'autres systèmes tels que les RMO "Health
Maintenance Organ~utionn" et le PPO "Profèrred Provider Organzkatitm" utilisent un paiement
fixé d'avance per capita ou pour chaque cas au Lieu d'une rémunération à l'acte afin de
s'assurer que ces organismes minimisent le nombre d'admissions et les durées dc séjour[54].
Au Royaumrne-Uni et au Canada, où les systèmes de santé sont universels, on a assisté à des
coupures budgétaires principalement aux dépens des hôpitaux de soins de courte durée avec
comme conséquence une diminution du nombre de lits disponibles. La revue de l'utilisation
des ressources vit donc actueilement un essor important en raison de ces changements[32].
Alors que la revue de l'utüisation des ressources s'adresse principalement à la surutilisation des
ressources, il est plausible que dans un proche avenir, elle s'intéresse aussi à La sousutilisation
afin d'assurer un niveau acceptable d'accessibilité aux soins. A la différence de la production
de biens manufacturés, la production de seMces de santé est hautement spécialisée, influencée
par l'état de santé et le comportement des malades. Elle est dépendante des habiletés, de la
compétence des médecins et de leur style de pratique. La revue de l'utilisation des ressources
doit donc être basée sur des notions fondamentales de la pratique médicale et ne doit pas être
réduite à un livre de recettes[S].
La revue de l'utilisation des ressources inclut, parmi diffkentes approches, la révision des
admissions des patients en s'appuyant sur des critères d é f i s etlou l'opinion d'experts.
L'objectif est d'évaluer l'efficacité du processus de soins et la pertinence de i'hospitaüsaîion en
fonction du site, de sa fréquence et sa durée(551. Elle peut être conduite pendant ou après
l'admission. Quatre aspects peuvent être revus: le type de soins qui a été donne le moment où
les soins ont été prodigués; la qyantité en texme de fkéquence et de durée; et L'endroit ou ils ont
été administrés. Elle est en relation étroite avec l'évaluation de la qualit6 des soins. Tandis que
la revue des admissions s'intéresse surtout au processus, l'évaluation de la qualité porte
davantage sur ta structure des soios, sur leurs effets de même que sur les séquelles des
traitements et la relation entre le dispensateur de soins et le patient[S6].
On reconnaît plusieurs bénéfices à la revue des admissions: la réduction des coûts par une
utilisation plus efficace; L'amélioration de la qualité des soins en diminuant la probabilité
d'infections nosocorniales et des maladies iatrogènes; le maintien de la qualité des soios en
assurant que les services hospitaliers prodigués sont de durée, de fréquence, et de niveau
suffisant pour promouvoir des soins optimaux; la préservation de l'accessibilité des ressources
pour ceux qui le nécessitent; la détermination de mesures étdom de soins ou de nomies[54].
Il existe plusieurs méthodes de revue des admissions. On distingue les méthodes par critères
implicites ou explicites, ou une combinaison des deux. La méthode utilisant les critères
implicites privilégie la revue du dossier par un médecin qui porte un jugement à savoir si
L'épisode de soins est pertinent. Dans la méthode par critères explicites, les critères sont
prédéterminés et le dossier est revu par un non médecin a h de déterminer si ceuxci sont
respectés. Ils peuvent être reliés ou non au diagnostic. ûn retrouve des avantages et des
désavantages à chaque méthode. Tandis que l'approche par critères implicites repose
essentiellement sur la co~aissance, le jugement et l'habilité de I'évaluateur, celie par critères
explicites repose sur la nature des critères choisis et la méthode utilisée pour en tirer les
conc1usions. Pour ces raisons, L'approche par critères explicites nécessite que l'instrument soit
fiable et valide. Ces instruments servent principalement de "screeningt ou moyen de dépistage
et ne peuvent donc pas être utilisés comme des uidicateurs définitifs de qualité des soins[56].
Ils permettent cependant d'identifier rapidement et de façon économique les soins ou les
services qui méritent une attention particulière de la part des cliniciens et des gestionnaires.
Quatre instruments ont principalement été utilisés dans la Linerature: l'AEP, FISD-A, le MCAP
et le SMI.
Ouols disponibIes pour Ia revue des admissions
Protocole d'évaluation de la pertinence (Appropn'ateness Evaluation Rotocol-AEP)[45]
L'AEP a été développé aux États-unis. Il est P l'origine de plusieurs autres outils d6veloppés
par la suite. II a ét6 vvalidé dans La littérature spécialisée[46]. Il mesure la pertinence clinique
d 'ye hospitalisation à l'admission à l'aide de seize critères et celie de la durée de séjour à
l'aide de vingt-cinq critères Les critères se fondent sur les services medicawc reçus, les
senrices infirmiers et I'état clinique du malade. Cet instrument a été utilisé dans de nombreus&
études aux États-unis, en France, en Italie, en Espagne, au Royaume-Uni et au Canadall8.27,
34, 37'41, 57, 581. Il est l'instrument du domaine public Le plus utilisé aux États-unis et en
Europe pour la pertinence des hospitalisations. Lang et coll.[37] ont traduit L'instnimynt et l'ont
utilisé dans un contexte h ç a i s après y avoir apport6 quatre modifications aux critères
proposés par Gertman et Restuccia [45]. Il peut être utilisé comme un instnunent de
monitorage dans le temps et entre d i f f h t s services hospitaliers [2q.
Grilles d'évaluation de l'intensité des services, de la gravité de la maladie et des congés (ISD
A, In fensity of semce, sevmerrty of illlne~s and dacharge smeens)[47,48]
Les critères explicites sur lesquels repose cet outil ne sont pas liés au diagnostic et examinent
les composantes d'une part, liées a la gravité de la maladie et d'autre part, à l'intensité du
service. Ces critères, basés sur L'AEP, ont été etablis par une compagnie privée américaine,
Interqual, où l'outil est couramment utilisé pour la revue de l'utilisation des ressources. Le
systéme a récemment fait l'objet de modifications importantes pour tenir compte de
l'obsemation des médecins. Il s'agit d'un outil utile pour évaluer si L'admission est pertinente
et si l'intensité du service requis est sutEsamment faible pour qu'on puisse envisager le recours
à des services alternatifs. Il existe également un ensemble de critères connexes pour juger de la
pertinence d'une intervention chirurgicale, à savoir le système de monitorage des indications
chimgicales (Surgery Indications Monitoring System-Sm, qui sont spécifiques
intervention. L'ISD-A est considéré dans la littérature médicale comme un outil
revue de l'utilisation des ressources[l4,46].
--
a chaque
valide de
Protocole d'évaluation de la pertinence des soins g a i s (Ma~uzged m e Appropriteness
Protocd-MCAP))C49]
Pour refldter le changement des prati~ues hospitalières issues des soins gérés (managed are),
le MCAP a été développé à la fin des années quatre-vingt sous la direction de Restuccia, par
Wellesley, une firme consuitante sur l'évaluation des soins de santé. La version initiale incluait
des critères applicables à la médecine, B la chirurgie, à la pédiatrie et à l'obstétrique. Les
critères sont basés sur la üttérahire pertinente et, encore une fois, L'AEP. Cependant, ils sont
plus explicites et identifÏent un plus grand nombre d'hospitalisations non pertinentes que i'ISD-
A et i'AEP[44]. II s'agit de critères explicites, non liés au diagnostic, utilises pour évaluer la
pertinence des décisions d'hospitaiiser mais aussi du maintien à l'hôpital par la suite pour les
patients en médecine, en chirurgie, en obstétrique et en pédiatrie. Se protocole, en plus de
fournir des critères visant à déterminer la pertinence, renseigne sur la nécessité des soins à
prodiguer lors d'interventions tant à l'interne qu'à l'externe. Une version plus récente a aussi
été développée pour les soins psychia&iques[59].
instrument normalisé d'examen des soins médicaux (Stundurdized Medreview Instrument-SiW)
1461
Il est construit à partir d a critères de I'ISD-A. La possibilité de modifier la décision (ovemde)
est inspirée de ZAppropriateneîs Evaluution Protocol (AEP). Il couvre les secteurs suivants:
médecine et chixurgie adulte; psychiatrie; soins intensifs et coronariens; réadaptation; et
traumatologie.
La fiabiIité et la validité des ~r inc i~aux outils de la revue des admissions
S. M. Payne a révisé les critères utilisés dans les études 6vaiuant la perfomance des principaux
outils de la revue des admissions[54~. Pour être utile, tout instrument doit être fiable et valide.
La fiabilité d'un instrument se définit par sa capacité à donner Le même résultat lorsqu'il est
appliqué plus d'une fois dans les mêmes conditions (intraobservateur) ou lorsque deux réviseurs
analysent le même dossier (interobsewateur). Trois mesures de fiabiiite interobservateur sont
£i&pemrnent utilisées :
L'Overall Amernent lOAl se d é f i t comme le pourcentage des cas pour lesquels les
réviseurs s'accordent. On distingue f accord parmi les cas jugés pertinents et ceux non
pertinents. Si on utilise l'accord pour l a cas jugés pertinents et non pertinents, on pade
alors de la ~romrtion dobale observée ou de l'efficience (quoique cette dernière expression
soit utilisée surtout dans les études de validité)). L'OA peut atteindre un niveau de 100%
même si les réviseurs sont incapables de distinguer les cas pertinents de ceux qui sont non
pertinents. Cela SurYiendrait si les réviseurs jugeaient tous les cas soit pertinents ou non
pettinents. Pour ces deux autres mesures sont devenues très utilisées dans ce type de
recherche soit le Specific Agreement et le coefficient d'accord Kappa de Cohen
Le S~ecifc Aweement est défini comme la proportion des admissions jugées pertinentes ou
non pertinentes par les deux réviseurs sur celles jugées pertinentes ou non pertinentes par un
ou l'autre des réviseurs,
Le coefficient d'accord Kama de Cohen est un ajustement du degré d'accord sumenu par
chance,
La validité d'un outil est sa capacité de refléter la vérité. On retrouve trois sortes de validité
dans ce type d'étude. La Face Validity est la capacité d'un instrument à mesurer toutes les
dimensions qu'il doit mesurer tel que déterminé par la conformité avec les règles de l'art. La
Content VaIidity se définit comme la capacité de L'instrument à mesurer les concepts pour
lesquels il a été planifié. La Convergent Validity se définit comme raccord entre l'instrument
et celui d'un panel d'experts par rapport a la pertinence.
En épidémiologie, d'autres mesures reflètent la validité. La sensibilité mesure la proportion de
ceux qui ont la caractéristique au test parmi tous ceux qui possèdent Maiment cette dernière. La
spécificité est la proportion de ceux qui n'ont pas la caractéristique au test panni tous ceux qui
ne possèdent vraiment pas cette dernière. La valeur prédictive positive d'un test mesure la
probabilité conditiome~e que la caractéristique soit présente lorsque le test est positif. La
valeur prédictive négative d'un test mesure la probabilité conditiome~e que la caractéristique
soit absente lorsque Le test est négatX Enhn, l'efficience se définit comme la probabilité que le
résultat du test et la caractéristique concordent. Cependant, afin de porter un jugement sur la
qualité de la mesure, on doit souvent r e c o u ~ a une mesure d'accord [60]. On utilisera alors les
mêmes mesures d'accord que celles de la fiabilité. Ainsi, le coefficient d'accord Kappa de
Cohen servira de mesure quantitative et sera alors utilisée comme un index de validité.
Sauf pour le S M , la fiabilité interobservateur des principaux instruments tels que L'AEP, I'ISD-
A et le MPAC a été jugée îrès bonne avez des taux #Overail Agreement de 84 à 92%, de
Specifc Non Anrte Agreement de 60 à 86% pour un coefficient d'accord Kappa de Cohen
variant de 0,6 a 0,85 [28, 36, 37, 40, 44, 45, 57, 59, 611. L'étude de Stmwasser [46] a
cependant montré des résultats moyens avec des coefficients d'accord Kappa de Cohen de 0,32
pour L'ISD-A et de 0'44 pour L'AEP. L'AEP, I'ISD-A et le MPAC ont fait l'objet d'une face
validity par les auteurs pendant leur développement [54].
En 1990, Stnunwasser et cou [46] ont évalué la validité de I'AEP, I'ISD-A et du SMI à partir
d'un échantillon de 119 dossiers de 21 hôpitaux de l'état du Michigan en comparant les
résultats de l'instrument à un panel d'experts. La valeur étalon était déterminée par le jugement
majoritaire des trois experts soit 2/3 ou 3/3. On a utilisé deux panels d'experts. Le premier
panel était formé de médecins rémunérés à l'acte. Les coefficients d'accord Kappa de Cohen
étaient de 0'18 pour I'AEP, 0,20 pour le SMI et 436 pour ITSD-A. Compte tenu que les
cliniciens provenaient de la même région, on a repris les études de validité en utilisant des
médecins experts provenant d'une autre région (la CaMomie) et travaillant dans un Health
Maintenance Organkation (HMO). Les coefficients d'accord Kappa de Cohen furent de 0,34
pour PAEP' O,L6 pou. le SM1 et 0,38 pour I'ISD-A. Le changement de panel a augmenté Les
taux d'accord pour 1'AEP et 1'ISD-A sans changer celui du SMI. L'auteur conclut que le SM ne
devrait pas être utilisé et que I'AEP et ITSD-A devraient l'être seulement comme test de
dépistage. Les études de validation du MPAC ont montré des résultats semblables à 1'AEP
i44I -
En 1997, Goldrnan et COU 1591 ont évalué la validité des versions psychiatriques 1992 et 1993
de L'ISD, le MPAC et un instrument développé dans les centres pour vétérans. La pertinence
des admissions fut &du& à partir d'un échantillon de 70 patients s o e t de troubles
psychiatriques excluant les maladies chniques et les cas de désintoxication. La sensibilité et
la spécincité ont été évaluées par comparaison entre l'instrument et le consensus d'un panel
d'experts. Les résultats ont montré peu de différence entre les instruments. Le MPAC et la
version 1993 de 1'ISD ont mieux performé avec une sensibilité et une spécificité au delà de
0,75. Le coetncient d'accord Kappa de Cohen pour les quatre instruments a varié entre 0'4 à
0,6.
L'ISD-A a été validé auprès de différentes clientèles (chirurgie, médecine, psychiatrie)
d'hôpitaux de vétérans américains 1401. Les réviseurs ont appliqué l'itlstniment à un
échantillon aléatoire de 2,432 admissions choisies a partir de 24 hôpitaux de vétérans. Un sous
échantillon de 70 dossiers a se^ à déterminer la validité. La validité a été évaluée en
comparant L'évaluation de réviseurs au jugement implicite d'un panel de neuf médecins.
L'Overall Agreement était respectivement de 74% pour la médecine et la chirurgie (Kappa
>0,4), alors qu'il n'était que de 66% pour la psychiatrie Wppa 0'29). Le coefficient d'accord
Kappa de Cohen fut jugé modécé pour la médecine et la chirurgie et faible pour la psychiatrie.
L'ISD-A a été valide au Royaume-Uni par Ingiis et COU [36]. Un échantillon de 700
admissions de patients en médecine et en gériatrie a été évalué sur une période de 6 mois. Un
sous échantillon de 168 admissions a été soumis à deux panels d'experts, L'un formé
d'omnipraticiens et l'autre de six médecins spécialistes provenant de l'hôpital où l'étude fut
faite. Le panel d'omnipraticiens devait porter son jugement en tenant compte que plusieurs
alternatives à l'hospitalisation étaient disponibles alors que le panel de consultants hospitaliers
devait porter son jugement en tenant compte des ressources disponibles. On a utilisé l'opinion
de la majorité comme mesure étalon. II est intéressant de noter que lYOverall Agreemeni était
de 68%, le Speczifc Non Acute Agreement de 59,2% pour un coefficient d'accord Kappa de
Cohen de 0,332 lorsque I'ISD-A était comparé au panel d'omnipraticiens dors que ces mêmes
mesures n'étaient pas valides lorsqu'on utilisait les consultants comme experts. L'auteur
conclut que la validité de 1-A varie dans la mesure où des a l t d v e s à l'hospitalisation
sont dispon.iiles,
En plus de i'étude de Stnrmwasser, L'AEP a Ct6 M u é dans d'autres pays dont la France [371,
le Royaume-Uni [42], [62],[63] et le Canada [64] auprès d'autres clientèles que celles admises
de l'urgence pour des soins médicaux adultes dont la pediatrie [63] [64] et la gériatrie [42]. Au
Royaume-Uni, 1'AEP a kt6 utilise auprès d'une clientHe d'adultes admise pour des soins
mkdïcaux de I'urgence d'un hôpital g é n M [62]. Un échantillon de 10% a été choisi de façon
aléatoire parmi 8210 arimissions. La validité de L'AEP a été déteminée par rapport à la
décision majoritaire d'un panel d'expert formé de rix cliniciens. Un sous échantillon de 40
dossiers a été choisi au hasard parmi les 821 dossiers. Les résultats ont montré un Overoll
Agreement de 93%' un Spec@ic Non Acute Agreement de 80% pour un coefficient d'accord
Kappa de Cohen de 0.83. Ls auteurs concluent que I'AEP est un outil valide. Cependant, le
sous-khantilion de 40 patients était hsuf5sant pour estimer de façon valable les variables
pouvant nous permettre d'avoir une opinion sur la validité du test (H. Kraemer p.38) [60].
L'AEP a aussi été utilisé pour une clientèle pediatrique (P-AEP) au Canada [64] et au
Royaume-Uni [63] avec un protocole semblable mais des rWtats différents. En effet, le
Pediik-zc Appropriateness Evaluction Protoc01 (P-AEP) s'est avéré un outil valide chez une
clientèle pédiatrïque au Canada avec un coefficient d'accord Kappa de Cohen de 0'68 alors
qu'elle fut faible au Royaume-Uni avec un coefficient accord Kappa de Cohen de 0'29. Un
outil valide dans un système de santé ne l'est pas nécessairement dans un autre [63].
L'AEP a été utilisé pour une clientèle gériatrique au Royaume-Uni [42]. La clientèle choisie
provenait de l'urgence. L'échantillon comportait 186 dossiers qui ont été évalués
prospectivement sur une période de trois semaines. La prévalence d'admissions non pertinentes
était de 13% tandis que 11% des admissions étaient jugées non pertinentes par L'AEP.
L'instrument fut jugé valide par les auteurs à partir des mesures suivantes : sensibilité 97%,
spécificité 63%' valeur prédictive positive 95% et négative 75% pour un coefficient d'accord
Kappa de Cohen de 0.62. Cependant, 2 1'5% des dossiers de l'échantillon firent perdus de vue.
De façon générale, les outils de revue des admissions présentent des degrés variables de
validité. Cette variation depend de plusieurs faeu15 dont le système de santé, les alternatives à
l'hospitalisation disponibles et la clientèle visée. On doit également signaler des variations
selon que L'on utilise la majorité des opinions versus le consensus d'experts pour déterminer la
mesure étalon. Même à 1'ISD-A a été utilisé dans quelques études canadiennes et que I'AEP a
été utilisé auprès d'une clientèle pédiatrïque au Canada, aux États-unis et au Royaume-Uni,
1'AEP n'a jamais été validé auprès d'une clientèle gériatrique dans le contexte canadien et
québécois des services de santé-
Les coûts des outils de ~ertinence des admissions
II s'avère très dispendieux pour un centre hospitalier de recourir a certains des outils. En effet,
L'ISDA et le MCAP appartiennent a des compagnies privées américaines et les coûts
d'acquisition et d'utilisation sont importants. L'utilisation de tels outils peut coûter jusqu'à
100,000$ par année. L'AEP, quant a lui, appartient au domaine public et son utilisation est
gratuite.
En résumé, plusieurs facteurs expliquent toute l'attention portée à L'évaluation de la pertinence
des admissions actuellement, Les pressions exercées sur le réseau de soins et de senrices pour
une meilleure efficacité et efficience sont énormes. La Littérature rapporte des proportions
élevées d'admissions non pertinentes dans certaines disciplines. La clientèle âgée et gériatrique
occupera une proportion encore plus grande des hospitalisations dans le contexte du virage
ambulatoire et il s'avère essentiel de connaître Ia valeur des outils utilisés pour mesurer la
pertinence des admissions dans la mesure ou celle-ci peut varier en fonction de plusieurs
variables dont les s e ~ c e s alternatifs à L'hospitalisation, le système de soins de santé et le type
de clientèle. Or, peu d'études ont été réalisées auprès de cette clientèle. Les incitaü's seront
nombreux tant a l'échelle provinciale que régionale pour que Les administrations hospitalières
recourent à ce type d'outils si l'on se fie aux recommandations du Vérificateur Général du
Québec dans son dernier rapport. Même si plusieurs outils existent, I'AEP allie plusieurs
qualités : c'est l'outil qui a été utilisé dans le plus grand nombre de pays, sa validité est somme
toute comparable aux autres. il a été utilisé dans le contexte des soins gériatriques, il appartient
au domaine public; il a été validé en fiançais; et son coût est nul alors qu'il faut débourser des
dizaines de milliers de doIIars pour empIoyer I'ISD-A ou le MCAP.
OBJECTIF DE L'ÉTUDE
Déterminer la validité (sensibilité, spécificité, valeurs prédictives, efficience) de 1'A.E.P. dans
le contexte des soins de santé de la région de Québec en gériatrie et dans les autres disciplines
médicales.
La population h l'étude
La population à l'étude a été sélectionnée à partir d'un échantillon aléatoire des départs des
disciplines midicales du C.H.A. ( Pavillon Enfan-Jésus ) entre le 0 1/04/97 et le 3 1/03/98. Le
Pavillon Enfânt-Jésus est un centre hospitalier afnlié a L'Université Laval de 381 Lits. Sa
mission comporte un volet de soins tertiaires en traumatologie et en neurochirurgie de même
que des soins généraux et spécialisés en médecine, en chirurgie et en psychiatrie. Il n'y a pas
d'obstétrique et seulement 12 lits de pédiatrie desservant le secteur de la neurochirurgie. La
médecine est représentée par plusieurs disciplines incluant la cardiologie, la dermatologie,
l'endocrinologie, la gastro-entérologie, la gériatrie, l'hémato-oncologie, la médecine interne,
la médecine familiale, la microbiologie, La neurologie, la physiatrie, et la pneumologie. Ces
disciplines disposent de 143 lits. Eues ont représenté, pour Pannée 1997-98, 47,934 jours
d'hospitalisations pour un séjour moyen de 10 jours et un taux d'occupation de 91%. L'unité
de courte durée gériatrique -W.C.D.G.) représente environ 10% des admissions et 13% des
jom d'hospitalisations. Le pourcentage d'admissions provenant de l'urgence des secteurs
médicaux y est de 85%. Les spécialités médicales sont regroupées dans quatre départements
(médecine, médecine générale, gériatrie, neurologie). Toutes les disciplines médicales ont
des cliniques extemes spécialisées. Depuis 12 ans, les clùiiciens disposent d'une unité de
médecine de jour destinée aux soins ambulatoires tant pour les interventions diagnostiques
que thérapeutiques. On y retrouve &galement plusieurs semices destinés a la population âgée
tels qu'un hôpital de jour. un
centre de jour, un service de
unité de réadaptation fonctiome11e intensive (U.R.F-L), un
psycho-gériatrie ambulatoire et des semices de maintien à
domicile provenant de trois centres locaux de services communautaires (C.L.S.C.). Les
demandes de s e ~ c e s de soins à domicile sont coordonnées depuis près de dix ans par une
équipe de liaison comportant quatre infinnières Les disciplines suivantes ont été exclues de
I'étude parce qu'eues ne constituaient que 0.4% des admissions : la dermatologie, ia
microbio Iogie et la physiatrie.
Dans la littérature, la prévalence des admissions non pertinentes pour le secteur médical varie
entre 10 et 20%. Considérant les paramètres tels que le taux d'admissions de l'urgeace et les
services altematifs à L'hospitalisation au CHA, on devrait s'attendre à une prévalence de 10%
en médecine et 20% en gériatrie. Afin d'estimer le nombre d'admissions non pertinentes
selon 1'AEP avec une précision de 2,95%, un risque alpha de 5% et une puissance de 80%, un
échantillon de 300 individus parmi un total de 475 admissions en gériatrie et de 300 parmi un
total de 4215 admissions dans les autres disciplines médicales fut requis.
Afin de déterminer fa validité de I'AEP, nous avons estuné qu'un sous échantillon d'environ
60 dossiers en médecine (10% x 300 dossiers = 30 dossiers non pertinents (tous les dossiers
non pertinents sont retenus) plus 30 dossiers tws au hasard panni les 270 dossiers pertinents)
et 90 dossiers en gériatrie (20% x 300 = 60 dossiers (tous les dossiers non pertinents sont
retenus) plus 30 dossiers tirés au hasard parmi les 240 dossiers pertinents) serait utilisé.
L'utilisation d'un sous échantillon de manière prospective permet de réduire le nombre de
dossiers à être évalués par les cliniciens (compte ttenu du temps Limité qu'ils possèdent) tout
en s'assurant d'obtenir des estimations valides de la prévalence, de la sensibilité, de la
spécificité, des valeurs predictives et de l'efficience dans la mesure où les marges
apparaissant dans un tableau 2 x 2 sont supérieures à 10 [60].
Le type d'étude
11 s'agit d'une étude de revue des dossiers. En plus d'être moins contraignante, ce type de
revue permet de réviser des dossiers complets et élimine Pincertitude des tests de laboratoire
à venir. Les réviseurs tendent à être plus objectifs parce que leu. jugement n'a pas d'impact
sur les soins donnés aux patients. Enfin les cliniciens n'ont pas tendance à modifier leur
comportement sachant qu'une étude est en cours. Cette approche a été utilisée abondamment
dans la Littérature [18] 1221, [36], [371, [41], 1461, [64], 1621, [63]-
La mesure des admissions non pertinentes selon 1'A.E.P.
Pour déterminer les admissions non pertinentes selon Péchelie de :'A.E.P., le protocde établi
par Restuccia fût respecté intégralement[45] Ce protocole prévoit 4 étapes pour déterminer à
la fois les admissions non perhentes et les motifs de non pertinence. La première étape
(application of criteria) consiste à appiiquer les 16 critères explicites mentionnés dans
l'A.E.P. dont 6 sont applicables aux services cliniques et 10 à la condition du patient (annexe
2 ) . Une archiviste fut entraînée à utiliser l'instrument selon les directives proposées dans un
protocole obtenu auprès du Dr Restuccia. La deuxième étape consiste à réviser tous les cas
autant ceux qui répondent a au moins un cntère que ceux chez qui on ne retrouve aucun
cntère. Ces dossiers ont été soumis au réviseur (IM) afin de considérer la possibilité de
déroger au classement (Considerution of ovewde) de manière à rendre justice à la situation
clinique particuiière de chaque malade. La troisième étape (determination of
appropriateness) consiste à décider de la pertinence ou non pertinence de l'hospitalisation.
La quatrième étape (assignment of reasons for inappropriateness) consiste à identifier les
raisons de non pertinence de l'admission. (annexe III)
Tel que décrit par Restuccia, dans 95% des cas, la décision s'applique facilement lorsqu'un
des critères est retrouvé après une recherche dans le dossier du patient principalement dans
les notes évolutives médicales et nursing de même que dans les ordonnances et les
prescriptions. Il est possible d'utiliser "l'override" (modification de la décision de l'archiviste
par le responsable (JM)) tel que précisé précédemment en utilisant des critères établis au
protocole pour les cas OU il est jugé que le patient nécessite une admission mais qu'aucun
critère n'est retrouvé ou vice-versa. L'override ne peut s'appliquer si la raison d'admission
non pertinente est retrouvée pa- les causes d'admissions non pertinentes tel qu'elles
apparaissent au protocole sous la rubrique "raisons de non pertinence des admissions"
(annexe m). L'archiviste s'est familiarisée avec l'instrument avant de débuter la revue des
dossiers à partir de dossiers sélectiomés par M.
La mesure des admissions non pertinentes selon le consensus des cüniciens: h mesure étalon.
Ann de déterminer la valeur étalon des admissions pertinentes ou non, un groupe d'experts
cliniciens ne connaissant oas les critères de 1'AEP a évalué de façon indéoendante et à partir
de leur expérience clinique, les dossiers jugés non pertinents selon la démarche décrite
précédemment en plus d'un échantillon aléatoire des dossiers jugés pertinents. Le groupe
était formé de trois cliniciens dont deux provenaient du CHA et un de l'extérieur. Les trois
cliniciens sont tous spécialistes dont un en médecine inteme et deux en gériatrie.
L'établissement de la valeur étalon par les cliniciens s'est effectué en deux étapes. Pour la
première étape, les cliniciens ont évalué tous les dossiers de façon indépendante. La
deuxième étape a consisté en une conférence consensus afin d'en arriver à un jugement
unanime parmi les dossiers divergents. Au cours des deux &tapes, les cliniciens ont reçu les
mêmes consignes. Ceux-ci jugeaient de la pertinence de l'admission en considérant la
vocation de soins de courte durée de l'hôpital et en tenant compte des alternatives disponibles
à l'hospitalisation. Ils devaient baser leur jugement à partir des informations consignées au
dossier précédant ou au moment de L'admission. Ils n'avaient pas à porter de jugement quant
à la qualité des soins ou à la précision du diagnostic. Lorsqu'ils jugeaient que l'admission
n'était pas pertinente, ils devaient indiquer la raison qui justifiait leur choix. Nous avons
utilisé ce processus de décision parce que le jugement d'un groupe interagissant ensemble est
plus précis que la moyenne des jugements indépendants ou le jugement d'un seul membre.
Une technique semblable fut utilisée récemment pour la validation de critères en
psychiatrie[59].
La mesure des raisons d'admissions non pertinentes selon I'AEP et les cliniciens
La revue de la littérature nous indique plusieurs raisons d'admissions non pertinentes[54]. On
retrouve celles reliées au patient et H sa famile, au médecin, à l'h8pital et aux savices
alternatifs existants dans lCenvironnemmt de l'établissement. Le protocole de l'AJ5.P. en
prévoit une typologie (annexe IïQ. De plus nous avons prévu à l'annexe 4 que chaque
clinicien qui déterminait qu'une admission n'était pas pertinente, devait le justifier en y
indiquant la raison. Celles-ci ont étk regroupées selon la m b e typologie que celle de
Restuccia à L'annexe IZT.
Autres variables retenues
Les données suivantes ont été tirées du dossier madical de tous les patients inclus a L'étude: le
numéro de dossier hospitalier, la date et l'heure d'admission, la date du départ, l'âge et le sexe,
le code postal, le type d'admission (en provenance ou non de l'urgence), la discipline
médicale dans laquelle le patient fùt admis.
Le d6roulement de l'étude
L'archiviste a fourni la liste de tous les admis-sortis de l'année fiscale 1997-98 des patients
inclus à l'étude. On a sélectionné à partir d'une Este de nombres aléatoires générés par
ordinateur (logiciel SAS), un échantillon de 300 admis-sortis en gériatrie parmi les 475 de
l'unité de courte durée gériatrique et de 300 dans les autres disciplines médicales parmi les
4,215 admis-sortis, sauf la dermatologie, la microbiologie et la physiatrie qui ne constituaient
que 0,4% des admis-sortis. Ces 600 dossiers ont été évalués par une archiviste entraînée avec
L4.E.P. afin de détemillier le pourcentage d'admis-sortis jugé non pertinents sous la
supervision de M. En même temps, on a extrait du dossier les informations conduisant à
identifier les raisons d'admissions non pertinentes par LM.
Parmi les 300 admis-sortis révisés en gériatrie, quatre dossiers fiirent rejetés parce que
l'admission fut faite directement en hébergement et ne constituait donc pas une admission en
courte durée. Parmi les 300 admis-sortis révisés dans les disciphes medicales, sept furent
rejetés parce qu'il s'agissait de réadmission provenant d'un autre centre de courte durée à
L'intérieur d'une période de sept jours.
Tous les dossiers jugés non pertinents (N,=77) en gériatrie parmi les 296 admissions et un
échantillon aléatoire de (&=30) dossiers parmi les 219 restants de même que tous les
dossiers jugés non pertinents (&=36) en médecine parmi Les 293 admissions et un
échantillon aléatoire de (N,=30) dossiers parmi les 257 restants, furent soumis de façon
indépendante aux trois médecins cliniciens provenant de la gkatrie et de la médecine. Les
dossiers qui n'ont pas démontré d'accord entre les médecins (29/107 en gériatrie et 23/65
dans les autres disciplines médicales) fiirent réévalués lors d'une rencontre visant à forcer un
consensus.
L'analyse des donn6es
On a utilisé un tableau de Wquence pour décrire la population à l'étude selon des variables de
personnes, de temps et de lieu en indiquant les pourcentages. Les comparaisons entre
l'échantillon et la population ont été faites en utilisant le test du Khi carré pour les
proportions.
Les mesures de fiabilité et de validité utilisées furent les suivantes:
Les mesures de fiabüité [62j
L'Overall Agreement (OA) se définit comme le pourcentage des cas pour lesquels les
réviseurs s'accordent.
Le Specific Non-Acute Agreement (ou Specijc Inappropriate Agreement) se définit
comme la proportion d'admissions jugées comme non pertinentes par les réviseurs sur le
total des admissions jugées non patinentes par un ou Ira- des réviseurs.
Le coefficient d'accord Kappa de Cohen est une maure d'accord tenant en compte le
degré d'accord survenu par chance.
Les mesures de validité
La validité fit déterminée selon la méthode d e t e par HE. Kraemer [60]. Les résultats de
I'AEP furent comparés avec le jugement par consensus des cliniciens.
Il y a quatre rénilfats possibles pour diagnostiquer et évaluer chaque patient (figure 3):
Vrai positif (VP): le test et le diagnostic sont positifs.
Vrai n é g a t i f o : le test et le diagnostic sont négatifis.
Faux négatif(FN): le test est négatif et le diagnostic est positif.
Faux positifrn): le test est positif et le diagnostic est négatif.
L'évaluation d'un test médical repose sur l'estimation des résultats de ces probabilités ou une
combinaison de celles-ci (figure 3).
La sensibilité est définie comme la probabilitb d'avoir un test positif parmi les patients qui
ont eu un diagnostic positif:
sensibilité = SE = VP/(VP+I;N) = VP@
La spécificité est définie comme la probabilité d'avoir un test négatif panni les patients qui
ont eu un diagnostic négatif:
speCincit6 = SP =VN/(FP+VN) = W P r
(PI= le complément de P ou 1-P)
La valeur prédictive positive d'un test est la probabilité d'avoir un diagnostic positif parmi
les patients ayant un test positifi
valeur prédictive positive = VPP = VP/(VP+FP) = VP/e
La valeur prédictive négative d'un test est la probabilite d'avoir un diagnostic négatif
panni Les patients ayant un test négatif:
valeur prédictive nbgative = VPN = VNf(VN+FN) = VNfg
(Qf= Le complément de Q ou 1-Q)
L'efficience est definie comme la probabilité que le test et le diagnostic concordent:
efficience = EFF = VP+VN
Conceptuellement, la méthode la plus simple d'échantillonnage consiste à utiliser le même
échantillon pour Le test (AEP) que pour le diagnostic (consensus des ~Liniciens). Cependant,
comme il était plus nifficile de réunir les cliniciens et plus coûteux qu'ils révisent tous les
dossiers. Nous avons déterminé l a probabilités citées plus haut par la méthode dite "de
sous-échantillonnage prospectif" décrite aussi par H.C. Kraemer [60].
Tous Les patients tirés de I'échantillonnage aléatoire (N,=296) en gériatrie et WOz293) en
médecine, ont été évalués avec L'AEP. Tous les dossiers jugés non pertinents par I'AEP
(N,=77 en gériatrie et N,=36 en médecine), de même qu'un échantillon aléatoire de N,=30
parmi les 219 jugés pertinents en gériatrie et de N2=29 parmi 257 jugés pertinents en
médecine ont été évalués par les cliniciens.
Si N, et N, excèdent 10 et que leur nombre est SUffisa~~nent grand pour garantir qu'il y aura
au moins 10 patients avec un diagnostic positif et négatif selon le consensus des cliniciens,
alors la proportion de patients avec un test positif Q est un estimateur non biaisé du niveau du
test Q, la proportion de ceux avec (VPP) est un estimateur non biaisé de VPP et la proportion
de ceux avec un (VPN) est un estimateur non biaisé de VPN (figure 3). Leur erreur type peut
être estimée a partir des équations suivantes:
erreur type (Q) = (a l -Q) l NJ
erreur type (VPP) = [VPPf 1 -VPP)/N,)
erreur type (WN) = WPNtl-VPN)/NJ
A partir de ces estimations de Q, VPP et VPN, les probabilités suivantes peuvent être
estimées:
Ainsi, la prévalence, la sensl'bilité, la spécificité et l'efficience peuvent être estimkes
directement:
P = Q-VPP [email protected]~
SE=Q-WP/P
SP=QWPN,P
EFF = Q-VPP + QI-VPN
La lé~timité du test
Pour être valable, un test doit être au moins légitime. Pour s'en assurer, il faut démontrer que
le test fait mieux que le hasard. Cependant, la légitimité d'un test ne nous informe pas sur sa
qualité. Chaque patient a une certaine probabilité d'avoir un diagnostic positif (pi) et une
certaine probabilité d'Etre positif au test (qi). Comme le diagnostic (consensus des cIiniciens)
et le test (AEP) ont été faits de façon indépendante et aveugle, la probabilité d'un vrai positif
v) pour un patient i est:
pi.qi
A partir d'un éch;intillon tiré de la population, la probabilité d'im vrai positif est:
VP = moyenne @ i. qi)
Ce qui équivaut mathématiquement à:
VP = PQ +p. q.aq
où p est le coefficient de correlation entre le test et le diagnostic et ap.crq respectivement
l'kart type de p et q.
De façon similaire, les autres probabilités sont:
FN = P@-p. q.oq
FP = P'Q-p q.oq
VN = P'e++p. q.aq
Pour un test au hasard (@)
VP = PQ, FN=PQr, FP = P'Q, VN = PI@
Pour un test Légitime @>O)
W P Q , FN-, W&Q, VN>p@
Enhn, pour un test et un diagnostic en parfait accord (le test idbal), lequel n'est possible que
lorsque le niveau du test (Q) est le même que Ia pr6valence (P====):
VP=P, FN=FP=O, vN=P
Ann de comparer VP avec PQ, FN avec P@, FP avcc P'Q et VN avec pie', on utilise le test
du x2. Plus il y a de mérence entre ces probabilités et plus le test est légitime. En d'autres
termes, plus le résultat du xZ est élevé et plus le test est légitime. Les valeurs de références
du x2 sont 3,84 (niveau de signification de 5%), 6,63 (niveau de signification de 1%) et 10,83
(niveau de signification de O, 1 %).
Il y a d'autres façons d'exprimer le test du x2. Pour un sous échantillonnage prospectif,
(figure 3)-
x2 = (N,+Na WF-K(I,O) - ~(0.0)
WF=(OQ-OQ~P-P~/(OP-OP~-Q*Q~)
QQ=N,fW,W 0P=P/(N1+NJ
~ ( 1 ,OHSE-Q/Q1)
IC(O,O) = (SP-QL/Q)
K(~,O)=(PQ' ~ ( 1 ,O) + PIQ K(O,O)] /(PQ'+plQ)
Intemrétation de la sensibilité. de la saécificite. des valeurs ~rédictives et de l'efficience d'im
Le problème de la sensibilité et de la sp&z~cité
La sensibiiitk et la spécincité sont d a mesures non calibrées de la qualité d'un test. Ces
mesures possedent tous deux un point zéro et une échelle variable. Le problème avec
l'interprétation de ces mesures peut être exprimi dans l'exemple suivant Si je dis qu'il fait 40
degrés à l'extérieur, est-ce que cela indique par Ic f ~ t même sril fait chaud ou fioid? Pour le
savoir, je dois préciser si l'échelle utilisée est en Celsius ou en Fahrenheit et à quel degré sont
les points de congélation et d'ébullition de ces deux échelles (32 et 212 respectivement si
l'échelle est en Fahrenheit et O et 100 si l'échelle est en Celsius). Alors, lorsqu'on rapporte
qu%i test est spécifique à 99.9% mais non légitime? le fiiit est que 99,9% peut ne pas être
sfisamment élevé.
Mathématiquement, la sensibilité et la spécificité sont exprimées comme suit:
SE=VPP Sp=VNIPr
ou SE = Q + popdq/P SP = Q1 + popcrq/Pi
Alors pour un test au hasard (p = O), la sensibilité égale le niveau du test (Q) et la spécificité
égale le complément du niveau du test @ = 1-Q). Pour un test légitime @O), la sensibilité
excède le niveau du test (SE>Q) et la spécificité excède le complément du niveau du test
(SP>Q'). Dans tous les cas, les valeurs idéales de sensibilité et de spécificité sont de 1,Q ce
qui est une valeur rarement atteinte. Que ce soit pour un test au hasard ou légitime, la
sensibilité et la spécificité ne varient pas de O a 1 mais de Q à 1 pour la sensibilité et de Q' à 1
pour la spécificité. Ainsi, lorsqufon donne les résultats de la sensibilité et de la spécificité, on
doit toujours indiquer le niveau du test (Q) pour pouvoir juger de sa qualité.
La qualité de la sensibilité ou de la spécificité dépend de l'endroit où elles se situent sur
I'échelle à Ifintérieur de certaines limites. Cela peut s'exprimer succinctement par les
expressions suivantes:
ic(l,O) = (sE-Q)/@ ~(0.0) = (SP- g)/Q La sensibilité peut bien être de 99,9%, mais si Le niveau du test (Q) est aussi de 99,9%. alors
la sensibilité est de q d t é "zéro" Iu(1,O) = 01. D'un autre côté, une spécincité de 70% pour
une test avec un niveau de 99,9% (Q' TOI) peut se révéler un excelient test ~~(0,0)=.0,691.
Les indices ~(1,0) et ~(0.0) sont donc des mesures de qualité de la sensibilité et de la
spécificité et des coefficients d'accord Kappa pond&&.
Le problème des va lws prgdicfiirës posifies et néga f i e s
Généralement. les chercheurs intéressés dans le développement et la documentation d'un test
semblent trouver la sensibilité et la spécificité plus attrayantes. D'un autre côté, les cliniciens
qui sont plus intéressés sur la façon dont le test peut être utilisé pour caractériser le patient ou
pour prendre des décisions cliniques semblent trouver les valeurs prédictives plus attrayantes.
Mathématiquement, les valeurs prédictives sont exprimées comme suit:
VPP = VP/Q VPN =VN/Q'
Si on se réfëre au modèle de base déjà évoqué:
VPP = P+(wpoq/Q VPN = PI + pcqmq/Qr
Alors, pour un test fait au hasard (p = O), la valeur prédictive positive égale la prévalence et
la valeur prédictive négative égale le complément de la prévalence (P'). Pour un test légitime
@>O), la valeur prédictive positive excède la prkvalence (VPP > P) et la valeur prédictive
négative excède le complément de la prévalence (VPN > Pl).
Encore une fois, Pévahation de l'importance des valeurs prédictives dépend de leur position à
Pintérieur des limites ou elles peuvent se situer. Les limites de Ia valeur prédictive positive se
situent de P à 1 et celles de la valeur prédictive négative de PI à 1 . Les indices de qualité
peuvent s'exprimer succinctement comme suit:
cc(O,O) = (VPP - P / p ~(1.0) = (VPN - P'IP)
Il apparaît donc hident que la qualité de la sensibilité est exactement identique à la qualit6 de
la valeur pr&-ctive négative et celle de la spécificité à la valeur prédictive positive.
Le problème de Iri@cÏence
Le problème de l'efficience dans la littérature médicale est que ce terme a été négligé dans
son utilisation alors qu'il est bien connu en sociologie et en psychologie.
Mathémaiiquement, l'efficience d'un test médical se définit comme suit:
EFF=VP +VN
Selon le modèle de base utilis6 précédemment:
EFF = (PQ + papaq) + (P'Q' + p-ap~q),
= PQ + PIQI + 2 - p - q ~ ~ q
Alors, pour un test fait au hasard (p = O), l'efficience est égale à:
EFF = PQ + P'Q Pour un test légitime @>O), l'efficience doit exceder la valeur PQ + P'Q'.
Comme pour la sensibilité, la spécificité ou les valeurs prédictives, l'efficience est une
mesure non calibrée avec une valeur qui dépend à la fois de la prévalence (P) et du niveau du
test (Q). Ceci a été noté il y a plusieurs années parmi des recherches effectuées en
psychologie. Cohen (1960) a suggéré que l'efficience pouvait être recalibrée afin de faciliter
son interprétation quantitative comme suit:
@FF - PQ - PQf)/(l - PQ - P'P) Cette valeur recalibrée fit appelée "coefficient d'accord Kappa de Cohen" pour la différencier
des autres coefficients Kappa. Il s'agit de l'indice de qualit6 de l'efficience ~(.5,0):
K(.S,O) = (EFF - PQ - P'Qi/(1 - PQ - PQf)
Comme pour les autres indices de qualité, ~ ( . 5 , 0 ) prend la valeur zéro pour un test au hasard
et 1 lorsque le test et le diagnostic sont en accord complet.
Maintenant, voyons comment cet indice de qualité est relié aux autres. Premièrement, notons
que:
I - P Q - P @ = P @ + P ~ Q Et alors, comme:
EFF = VP + VN E F F = P - S E ~ P * -SPI
Ainsi,
EFF-P-Q-P-Q=P-(sE-Q)+P-(sP~-Q)
=P- Q - Q ~(1.0) +P - Q - ~(0 .0 )
Et finalement:
K(-5,o) = [P@ ~(((1.0) + PQ K(o,o)]/P@ + P'Q)
Cette excursion algébrique démontre que la qualité de l'efficience est une moyenne pondérée
de la qualité de la sensibilité ou de la valeur prédictive négative (~(1,0)1 et de La qualit6 de la
spécificité ou de la valeur prédictive positive k@,O)l. Pour maximiser la qualité de
l'efficience, on doit avoir une bonne qualité de la sensîbilitt5 et de la spécificité.
Des standards pour évaluer leur importance ont été suggérés dans la littbrature. Un
coefficient d'accord Kappa de Cohen (S.0) au dessus de 0,8 doit être considéré "presque
parfaitt', entre 0.6 et 0,s "substantiel", entre 0,4 et 0,6 "modéré", entre 0,2 et 0,4 "passable", et
en dessous de O,2 " pauvre".
LES RÉSULTATS
Descrbtion de la oo~ulation et de l'échantillon (tableau
On a échantillonné 600 dossiers dont 300 en gériatrie parmi 475
(62,3%) et 300 dossiers dans les autres disciplines médicales autres
admis-sortis (7,1%) entre le 01/04/97 et 31/03/98.
patients admis-sortis
parmi 4,215 patients
Pamii les 300 patients admis-sortÏs en gériatrie, quatre (1,3%) furent rejetés parce qu'ils
étaient mal classifiés. Ces patients avaient été admis en hébergement et non en courte durée
et ce, dès l'admission. L'âge moyen était de 81 ans (écart-type de 7,4). Plus de 30% des
patients admis avaient plus de 85 ans. On retrouve 61,8% de t'échantillon de sexe féminin-
Ils proviennent surtout de l'urgence à plus de 80%. Le séijour moyen à l'unité de gCn*atrie
était de 14,6 jours avec un écart-type de 10,4 jours. Plus de 20% fiirent hospitalisés plus de
trois semaines. La distniution des admissions s'étend de façon homogène tous les jours de la
semaine saufpour une Iégére diminution le dimanche. Les patients sont admis de façon égale
le jour et en soirée, dors que les admissions de nuit ne constituent que 4% de l'échantillon.
Parmi les 300 patients admis-sortis dans les autres disciplines médicales, sept k e n t rejetés
(2,3%) parce qu'ils huent considérés mal classifiés par l'archiviste. Il s'agissait de patients
réadmis à l'intérieur de sept jours dors qu'ils avaient été transférés dans un autre centre
hospitalier de courte durée pour des soins tertiaires en cardiologie. Les disciplines médicales
représentées se disrribuent comme suit: 27.6% en cardiologie, 17% en gastro-entérologie,
4,4% en hémato-ontologie, 26,3% en médecine interne (incluant la pneumologie), 19,4% en
neurologie et 5,1% en médecine familiale. L'échantillon est composé de 293 admissions.
L'âge moyen était de 62 ans (écart-type de 17,7 années) et moins de 7.5% était de plus de 85
ans. On retrouvent autant d'hommes (50 3%) que de femmes (49,5%). Comme pour les
admissions en gériatrie, la majorité (83,6%) provenait de l'urgence. Le séjour moyen fut de
IO jours (avec un écart-type de 9,6 jours). Presque 50% des admissions ont une durée de
séjour < 7 et plus de 1 1,396 r 2 1 jours. Moins de 5% des admissions se font pendant la nuit
et sauf pour la fin de semaine? la distribution des admissions en semaine est assez égale.
La distribution des principales caract6ristiques dans la population, tant du côté de la gériatrie
que des autres disciplines médicales, est similaire tel que démontrée par des valeurs p>0,01
témoignant de l'absence de différence significative.
Fiabilité interobservateur
Nous avons évalué la fiabilité interobservateur avant le consensus entre les trois cliniciens
experts quant à leur jugement implicite. Pour ce f- un sous-échantillon comprenant toutes
les admissions jugées non pertinentes selon CAEP en gériatrie (N,=77/296) et en médecine
(N1=36/293) en plus d'un 6chantilIon aléatoire parmi Les admissions jugées pertinentes en
gériatrie (N2=30/219) et en médecine (Nz=29/257) (1 dossier perdu lors du consensus) fut
constitué (tableau II). En gériatrie, le coefficient d'accord Kappa de Cohen ~(.5,0) est faible
(EL vs E2=û,108, El vs E34,OLl et E2 vs E34J79). Pour les disciplines médicales autres
que la gériatrie, la concordance est de O,28 1 entre El et ES, O,3 82 entre E 1 et E3 et 0,572
entre E2 et E3. Bien que meilleure, la concordance demeure tout au plus fmile à modérée
(tableau II).
Compte tenu de la faible concordance quant au jugement implicite des cliniciens, nous avons
procédé à une conférence consensus parmi les 29 et 23 cas divergents respectivement en
gériatrie et dans les disciplines médicales autres (tableau m). Si on examine la répartition des
cas divergents parmi les dossiers révisés par les trois cliniciens experts (tableau IV), on note
que pour les 29 cas en gériatrie, le consensus est allé du côté de la majorité (2 cliniciens sur
3) 18 fois sur 29 (62%) et du côté de la minorité (1 clinicien sur 3) I l fois sur 29 (37,9%).
Le consensus se répartit dans le tiers des cas vers la minorité (1 clinicien sur 3) et dans deux
tiers des cas vers la majorité (2 cliniciens sur 3). Cependant, lorsque deux cliniciens sur trois
avaient la même opinion avant le consensus, ce dernier se dirige surtout vers la pertinence.
En médecine, le consensus est alié du côté de la majorité (2 cliniciens sur 3) 15 fois sur 23
(65,2%) et du côté de la minorité (1 clinicien sur 3) 8 fois sur 23 (34,8%). La distribution du
consensus se répartit encore une fois dans le tiers des cas vers la minorité et dans deux tiers
des cas vers la majorité. Cependant lorsque 2 cliniciens sur 3 ont la même opinion avant le
consensus, celui-ci se répartit à 50-50 entre la pertinence et la non pertinence. Lorsqu'un
clinicien sur trois considère le dossier non pertinent, le consensus se dirige toujours vers la
non pertinence.
Au tableau V, nous avons regardé la répartition des dossiers divergents en gériatrie et dans
les autres discipIines médicales autres selon qu'il s'agisse de l'évaluateur 1.2 et 3. Quand on
compare pour les évaluateurs 1, 2 et 3 la distniution des pourcentages avec et contre le
consensus, on note qu'il n'y a pas de différence significative en gériatrie @=0,238), dans les
autres disciplines médicales @=O,I 16), ou au total (p4.115). Ainsi, aucun des trois
cliniciens ne se démarque statistiquement quant a la proportion respective d'accord ou non
avec le consensus.
Validité de I'AEP
Afin d'évaluer La validité de FAEP, nous l'avons comparé au jugement par consensus d'un
groupe de trois cliniciens experts selon une méthodologie décrite antérieurement (figure 3).
En gériatrie, I'AEP fiit jugé non légitime en raison d'un Khi carré à 3,03 (seuil de
signification a 6% si x2 S,84), c'est-à-dire que les résultats au test ne se démarquent pas de
ceux attendus par le hasard. La sensibilité, ou la capacité de I'instnunent à mesurer les
admissions non pertinentes, était de 62%, La spécificité de 77%, la valeur prédictive négative
de 96,6% et positive de 15,5%. L'efficience était de 75,5%. L'indice de qualité de la
sensibilité et de la valeur prédictive négative (c(1,O) était de 0,048 alors que celui de la
spécificité et de la valeur prédictive positive ic(0,O) n'était que de 0,010- Celui de l'efficience
~(.5,0) était de 0,161. Ces résultats démontrent que pour une population gériatrique, I'AEP
ne démontre pas suffisamment de corrélation avec le jugement par consensus des cliniciens
pour être un test valide. L'AEP a surestim6 le nombre d'admissions non pertinentes de plus
de quatre fois en comparaison au jugement des cliniciens experts (tableau VI a).
L'AEP a aussi été évalué pour les autres disciplines médicales selon la même méthodologie.
Le test fut jugé légitime en raison d'un Khi Carré à 28.67 (seuil de signification a 10,1% si x2 210,83). La sensibilîté ou la capacité de l'instrument à mesurer Ies admissions non
pertinentes était de LOO%, la spécificité de 95%. la valeur prédictive négative de 100% et
positive de 63,8%. L'efficience était de 95,6%. L'indice de qualité de la sensibilité et de la
valeur prédictive négative k(1.0) était de 1 et celui de la spécificité et de la valeur prédictive
positive k(0,O) était de 0,608 alors que celui de l'efficience k(.5,0) était de 0,756. L'AEP
s'avère donc un instrument valide pour juger de la pertinence des admissions dans les
disciplines médicdes. Cependant, il ne peut servir que comme test de dépistage parce qu'il
surestime les admissions jugées pertinentes par les cliniciens par un indice de 1,s fois
(tableau VI b).
Raisons d'admissions non ~ertinentes
Au tableau W, on retrouve les raisons de non pertinence des admissions selon 1'AEP et
l'opinion des médecins experts suite au consensus en gériatrie et pour les autres disciplines
médicales. Nous avons regroupé dans la catkgorie A tous les items de I'annexe III se
rapportant aux intewentions diagnostiques et thirapeutiques (#1, 2, 3, 10). La catégorie B
regroupe les soins autres que courte durée (#4,5,6, 7, 1 1, 12). La catégorie C s'intéresse aux
admissions prématurées (item 8) ou avec une absence de plan (item 9). La catégorie D
regroupe l'item 13. soit la non cornpliance du patient à ses traitements. EnGn, la catégorie E
regroupe l'item 14 soit tous les autres cas.
En gériatrie, 75/77 (97,4%) des dossiers jugés non pertinents selon l'AEP et 12/13 (92.3%)
des dossiers jugés non pertinents selon les cliniciens étaient disponibles pour révision.
Respectivement, 21,3% et 25% des admissions non pertinentes selon 1'AEP et les cliniciens
sont attribuables a des interventions diagnostiques et thérapeutiques qui auraient pu être
accomplies en ambulatoire. La majorité des admissions non pertinentes étaient atûibuables
(70,7% selon l'AEP et 66,6% selon les cliniciens) à l'utilisation de soins de courte durée dors
qu'un autre niveau de soins était requis (le plus fréquemment, il s'agissait de soins de
réadaptation).
Dans les autres disciplines médicales que la gériatrie, on retrouve l'inverse. En effet, la
majorité des admissions non pertinentes est plutôt secondaire à une mauvaise utilisation des
services ambulatoires (72% selon L'AEP et 91,3% selon les cliniciens), alors que c'est la
minorité qui était amibuable au fait qu'un autre niveau de soins que la courte durée aurait été
requis (environ 20% selon I'AEP et seulement 4.35% selon Ies ~Iiniciens).
DISCUSSION
Principaux rkultats
La validité de llAEP a été étudiée à partir d'un échantillon représentatif des patients admis et
ayant obtenu leur congé au cours de l'année 1997-1998 en medecine et n: gériatrie du Centre
hospitalier affilié - Pavillon Enfant-Jésus, un centre à vocation tertiaire en traumatologie et
neurochirurgie.
L'Appropriateness Evaluation Pvotocol s'est av& une instrument valide pour les disciphes
médicales et non valide en gériatrie pour juger de la pertinence des admissions. L'AEP a
tendance à surestimer la non pertinence des admissions en comparaison a un consensus
formulé par des cliniciens experts.
L'évaluation de la pertinence ou non des admissions à l'aide du jugement des cliniciens pris
individuellement est peu fiable. Dans la présente étude, le processus de validation de la
mesure étalon mis en place afin d'en arriver à un consensus parmi les cas jugés divergents n'a
pas 6té influencé par la pression de se conformer au jugement de la majorité ni par la
prépondérance d'un des cliniciens puisqu'aucun ne se démarquait statistiquement quant à la
proportion respective d'accord ou non avec le consensus.
Lorsqu'on considère les services disponibles plutôt que ceux les plus appropriés dans un
contexte idéal, une sous-utilisation des services diagnostiques et thérapeutiques en
ambulatoire apparaît comme la principale raison d'admission non pertinente dans les
disciplines médicales. En gériatrie, L'utilisation de lits de courte durée pour des patients qui
nécessitaient des soins de réadaptation apparaît comme la principale raison d'admission non
pertinente.
Forces et faiblesses
Parmi les forces de cette étude. il faut noter la qualité de l'échantillon qui représente très bien
les admissions dans les disciphes médicales et en gériatrie au cours d'une année complète
que ce soit selon ltâge, le sexe, le type d'admission, la durée de séjour de même que le jour et
l'heure d'admksion. De plus, tous les dossiers de patients sélectionnés ont été retracés et
révisés pour s'assurer de leur concordance avec les critères de sélection dans l'étude. Aucun
dossier de patient da été perdu au suivi ce qui contraste avec certaines études faites sur la
validité de I'AEP. Tsang a pris une population gériatrique provenant à 100% de la salle
d'urgence admise prospectivement sur une période de trois semaines. Même si l'auteur
conclut que L'AEP est valide, on ne peut malheureusement pas éiiiminer lrintroduction d'un
biais de sélection compte tenu du fait que sur 186 admissions, 21,5% étaient perdus de vue
pour l'analyse[42]. Il est certain que le fait d'avoir utilisé dans la présente étude un
échantillon de patients ayant déjà obtenu leu. congé et dont les dossiers provenaient des
archives, a permis de minimiser les perdus de vue.
L'AEP est une procédure systématisée de mesure de la pertinence des admissions en courte
durée. L'échelle s'appuie sur 16 critères explicites indépendants du diagnostic qui réfêrent
aux services médicaux reçus, aux services infinniers et à Pétat clinique du malade. Les
informations permettant de retrouver un des seize critères sont relativement faciles à obtenir.
L'instrument a également prévu la possibilité de déroger aux critères selon des instructions
prévues au protocole. Dans l'étude présente, des contacts ont été établis avec le docteur
Reshiccia afin de s'assurer d'obtenir le protocole et de suivre rigoureusement les diffi5rentes
étapes. Pour des raisons de faisabilité, deux des trois cliniciens utilisés pour établir la mesure
étalon provenaient du milieu même où a été sélectionné l'échantillon. Certains des dossiers
qu'ils ont révisés étaient connus d'eux et malgré des instructions strictes quant a l'objectivité
qu'ils devaient conserver, on ne peut éliminer un biais d'information. Cependant, le
processus utilisé pour établir la mesure étalon a permis de minimiser ce biais puisque les
dossiers divergents ont été regroupés lors d'une conférence consensus et discutés séparément.
D'ailleurs, l'analyse des cas divergents a démontré que la méthode utilisée a permis aux
cliniciens de partager l'information sans qu'il n'y ait d'infïuence indue quant au poids de la
majorité ou la prépondérance de l'opinion diin clinicien par rapport à un autre.
Une autre force de cette étude réside dans le cadre d'analyse utilisé pour déterminer Ia
validité. La validité d'un instrument réside dans sa capacité de refléter la vérit6. Ii n'y a
évidemment pas dfùidicateur absolu pouvant nous assurer qu'une admission est pertinente ou
non. Pour cette raison, nous nous devons de comparer tout instrument avec le jugement d'un
groupe de cliniciens. Dans les études antérieures visant à valider L'AEP, on a utilisé l'opinion
d'une majorité de cliniciens [64], [62]. [461, [42], [63] plutôt que le jugement d'un consensus
d'experts. Dans La présente étude, nous avons déterminé la validité à I'aide de mesures de
sensibilité, de spécificité, de valeurs prédictives positives et négatives et d'efficience selon
une méthodologie décrite par &C. Kraemer [60]. Cette rnétbûdoiogie a plusieurs avantages.
Elle permet de juger de la légitimité du test et de la qualité des indices. De plus, elle permet
d'obtenir des estimations valables des valem Q (niveau du test), des valeurs prédictives
positives et négatives, tout en utilisant un sous échantiiion prospectif et ainsi limiter les coûts
et le temps d'utifisation des cliniciens experts.
Qu'en est-il de la validité externe
D'un point de vue statistique, les résultats sont généralisables à une population identique à
celle échantiilonnée. Rappelons que la population étudiée fut admise principalement via la
salle d'urgence (85%) dans un hôpital contenant des vocations tertiaires en traumatologie et
en neurochinirgie, sihié en milieu urbain et possédant une afnliation universitaire.
Il faut être prudent quant à la validité de l'instnunent dans un autre système de soins, avec
une clientèle différente dont les alternatives à l'hospitalisation et les experts définissant les
règles de pratique seraient différents. L'instniment s'est avéré valide pour les disciplines
médicales et non valide pour les malades admis en unit6 de courte durée gériatrique (UCDG)
alors qu'on a considéré les services disponibles et non ceux les plus appropriés. On sait que
l'instrument a été construit pour évaluer les besoins en courte durée alors que le clinicien est
souvent conf?onté à l'admission d'un patient en considérant d'autres facteurs, comme sa
condition psychosociale ou simpIement Ie fait que des mesures aiternatives ne sont souvent
pas disponibles.
CONCLUSION
Compte tenu des pressions de plus en plus fortes sur les ciiniciens pour une utilisation
efficiente des lits de courte durée, il devient de plus en plus nécessaire d'une part d'éliminer
toute mauvaise utilisation des lits de courte durée mais d'autre part de préciser la validité de
ces instruments provenant d'autres systèmes de santé et ce, en fonction de populations
différentes (gériatrique, pédiatrique, psychiatrique) et des senices altematïfi disponibles.
Cette étude a mis en évidence les difficultés inhérentes à l'utilisation d'instnunents validés
dans un autre système de soins de sant6 auprès d'une population souvent non gériatrique.
L'AEP s'est montré un instrument valide auprès d'une clientèle non génatnque mais a eu
tendance à surestimer les admissions non pertinentes. Cela est relié au fait que le système de
soins de santé au Québec ne comprend pas toutes les alternatives a l'hospitalisation ou que
celles-ci ne sont pas utilisées de façon optimale comme on pourrait le retrouver aux Etats-
Unis d'où proviennent ces instruments. Ainsi, l'utilisation de L'AEP devrait être restreinte au
dépistage des cas potentiels d'admissions non pertinentes et nécessiter la révision d'un
clinicien pour une opinion définitive.
Pour les patient& gériatriques traités dans le contexte des soins de santé au Québec,
l'instrument s'est avéré non valide contrairement à ce qui a été rapporté dans une étude
récente auprès de cette population au Royaumme-Uni[42]. D'ailleurs, une autre étude faite
récemment au Québec avec 1'1SD-AC et le MPAC permet de conclure que ces outils ne sont
pas adaptés au système de soins actuels [65].
L'avenir de la recherche sur l'évaluation de la pertinence des admissions en courte durée pour
une population gériatrique devra nous permettre de répondre aux défis suivants:
1. développer des outils valides qui tiennent compte des caractéristiques particulières de la
clientèle gériatrique principalement en regard de l'autonomie fonctionnelie;
2. t e k compte de I'accesm'bilit6 limitée aux ressources alternatives (Liste dratteinte a l'unité
de réadaptation fonctîomelie intensive (üRFI), en hôpitaux de jour, en lits d'hébergement,
de dépannage et de convalescence);
3. t e k compte des modifications des pratiques de soins en cours dans le d e u (virage
ambuiatoire).
Ultimement, on doit s'assurer du bien-être du malade dans des conditions de traitement et de
réponses awc besoins fondamentaux et ce, malgré la rareté des ressources. Compte tenu du
fait que l'efficacité des ressources aItematives de même que les économies potentielles
associées à leur usage demeurent encore contmvmées, on doit faùP attention de ne pas
diminuer l'accessibilité des Lits de courte durée à certaines clientèles [32].
ANNEXE 1: APPROPRIATENESS EVALUATLON PROTOCOL
CRITÈRES D'ADMISSION A P P R o P R I ~
Coma, inconscience ou désorientation d'installation récente. Pouls c 50 par minute ou > 140 par minute. Tension artérielle systolique c 90 ou > 200 mmHg etfou tension artérielle diastolique < 60 ou > 120 mmHg. Cécité ou surdité soudaine. Perte subite de la capacité de bouger un membre (une partie du corps). Fièvre persistante depuis plus de cinq jours > 37,8'C (lOO°F) buccale ou > 38,3'C (1 0 1 OF) rectale. Saignement actif. Troubles électrolytiques ou des gaz du sang graves:
a) Na (sodium) c 123 ou > 156 mmol/l b) K @otassium) c 2,s ou > 6.0 mmoM c) HCO, < 20 ou > 36 mmoM (sans qu'il n'existe des causes de chronicité) d) pH artériel c 7,3 ou > 7.45.
Évisc6ration ou déhiscence d'une plaie. Ischémie aiguë à l'électrocardiogrammee Médication intraveineuse etlou remplacement des pertes liquidiennes (n'inclut pas le traitement entéral) Chirurgie ou autre acte médical prévu dans les 24 heures nécessitant soit une anesthésie générale ou régionale; soit t'utilisation de matériel, de services uniquement disponibles dans un centre hospitalier Surveillance des signes vitaux (pouls, tension artérielle, fiéquene respiratoire, télémétrie) à toutes les deux heures ou moins. Prescription d'un traitement pharmacologique nécessitant une surveillance continue ou faisant craindre une réaction allergique ou hémomgïque. Antibiothérapie intramusculaire au moins trois fois par jour. Utilisation de façon in termi t te ou continue d'une assistance respiratoire au moins une fois toutes les huit heures.
ANNEXE II
Selon votre jugement clinique et vos connaissances des services intra et extra hospitalier au Pavillon EnfmtJésiis, croyez-vous qu'il €tait nécessaire d'admettre ce patient en courte durée?
1- oui 2- non
Si vous croyez que ce patient ne devait pas être admis, indiquez la o a les raisons qui motivent votre choix (Pourquoi?)
ANNEXE III
Raisons d'admissions non pertinentes:
Toutes les interventions diagnostiques etLou thérapeutiques auraient pu être accomplie(s) en ambulatoire
Les interventions diagnostiques etlou thérapeutiques auraient pu être accomplies en ambulatoire cependant le patient demeure trop bin du centre hospitalier
Les interventions diagnostiques evou thérapeutiques auraient pu être accomplies en ambulatoire cependant elles n'auraient pu être faites dans le temps requis
Le patient nécessite des soins institutionnels mais à un niveau autre que celui de courte durée
Le patient nécessite des soins dans un centre hospitalier de soins de longue durée (CHSLD)
Le patient nécessite des soins dans un centre d'accueil d'hébergement (CAH)
Le patient nécessite des soins dans une résidence d'accueil publique ou privée
L'admission est prématurée i.e. un jour ou plus avant qu'une intervention ne soit planifiée
Absence de plan prévu pour des interventions diagnostiques eVou thérapeutiques
10. L'intervention chirurgicale aurait pu être accomplie en ambulatoire
1 1. Le patient nécessite des soins palliatifs
12. Le patient nécessite que des soins sociaux pour des fins de protection contre un abus potentiel
13. Le patient n'est pas observant à ses traitements
1 4. Autre, spécifiez:
TABLEAU I : Comparaison quant aux caract6ristiques de Ia popdation cible et de
I'6chanüüon dCatoire en geriatrie et dans les disciplines médicaies
CARA~RISTIQUES 1 G & I ~ M ~ E 1 Admissions 1 IhhantiIIon 1 N475 1 ) 1 Ne96 1 (%) 1 *p I 1 I 1 I
M~DECINE Admissions &c bantiiion
N4215 / (./m.) 1 N=293 1 (%) 1 *p I l I I
I I
, Type d'admission
81,05 7,43
14,57
- Age Moyen. ( annk )
Écart-type Séjour moyen (jours)
Sexe
81,13 1 7,29 1
13.71
(83.61) ( 6¶63 (16,38) /
Urgent ( 420 Électif 1 55
Durée de séjour
'valeur p
F Écart-îype
Mascuiin Fdminin
Heure d'admission
11,75
1
10,37 1 1 IO,&
Age (années)
NS
NS
I I l
3474 1 (82,42) f 245 741 1 (1738) 1 48
(88,42) ( 259 (11,58) 1 37
(50,51) 1 0,885 (49.49) 1
2153 2062
(47.78) (29.69) (1 126)
0-6 jours 7=13 jours 14-20 jours
62,59 17.13 10,37
61.95 17,65 10.02
1 937
~ 6 5 6 (1,2631 4 (-9 1968 1(46,69) ) 139 1049 1 (24.89) f 73
75-84 229 (48.21) 149 (50.33) 0'93 V J 1 4 ) 1 59
0,89 179 296
097
(52.55) (42,32) (5,121
NS
NS I
(87,s) (12,s)
(4744) (24,91) (20,13) (7,s) 285 161 (33,89) 94 (31,75) 265
(51.08) (48.92)
140 87 33 O,99
221 jours
96 197 107
039 2097 1823 0,97
, 8h00-lm9 1 216 16h00-23h59 ) 238
O,73
OY76 (6,29) 1 22
148 145
(37.68) 1 1 13 (62.32) f 183
(38.17) (61,82)
33 1 (11.26) 9s 509
1971 1263 472
(20.21) 1 56 (41.4'7)) 116 (22,s) 1 67
(49,75) (43.25)
(45.47) (50,ll)
(15,79) 57 1 (19,25) (12,081
(46,76) (29,96) (1 1.20)
(18,91) (39.19) (22.63)
154 124
295 1 (7.0)
135 ) (45,6) 149 1 (50,33)
OhOO-7h59 1 21 1 (4.42) 15 12 1 (4.05)
TABLEAU II: : Fiabüitt interobservateur entre Ies trois cliniciens experts selon ieur jugement impiicite de ta pertinence des admissions en gériatrie et en médecine (E, : R6viseur 1, E, : Réviseur 2, E, : Rkviseur 3)
O.A. 4 , 8 9 SNA=O,OS Kappa (Cohen) =O, 108 LCI(-û,163, 0,378)
O A . 4474 SNA=O,O7 Kappa (Cohen) =0,011 1.C.-0,160, O, 182
O.A. 4 , 8 1 SNA=0,13 Kappa (Cohen) =û,Lïg I.C.-O,O 18,0,376
0.A: Overaii Agreement 1.C: Intervalle de confiance & 95%
O.A. : 0,75 SNA: 0,36 Kappa(Cohen) :0,382 LC-: O,l48,0,6lS
SNA: Specific Non Acute Agreement Kappa (.5,0): Kappa de Cohen
TABLEAU III : Résultats de la conférence consensus et de l'opinion des cliniciens experts quant i b pertinence ou non des admissions en g6riaMe et dans les disciplines médieaies
GÉRIATRIE Fr6q %
Consensus E, % & Fréq % Cum Ciim
12.1 16.7
Non pertinent Non pertinent Non pertinent
n(convergents)=78 n(divergents)=29
Non pertinent Non pertinent
, Non pertinent Non pertinent Non pertinent
: 1 1 0.9 2 1 1.9 5 1 4.7 6 1 5.6 7 1 6.5 13 112,l 17 1159
2 8 4.5 1 11
NP P P NP NP
NP NP NP P P
18 30
Non pertinent Non pertinent
NP I P NP I P P I N P
16,8 28.0
NP P
NP /NP NP INP
NP 1 1 ) 0.9 NP 1 1 1 0,9 P 1 3 1 2.8
Non pertinent , P Pertinent
107 1 100.0
8 3
NP 1 1 P 1 i
P \NP 1 6 , 5,6
Pertinent Pertinent Pertinent
4 6 1
NP 1 2
0.9 09
P P P
P NP
3.0 1 13 119.7 6.1 1 17 1 25,8
36.4 45,s 47.0
NP I P P 1 P NP I P
6.1 , 24 Non pertinent 1 P Pertinent INP
3.7 0,9 112 72.0
P I P 1 4
4 3 4.5
9,l 1.5 Pertinent
NP ]NP NP IN P P / P
20 1 30,3
P 1 P
30 31 P
Pertinent
1 12 77
100,O 35 1 53.0 P 66
TABLEAU N : Repartition des cas divergents parmi les dossiers r6visés par les trois clinfciens experts
Gériatrie CONSENSUS
2 cliniciens sur 3 1 16
n cliniciens sur 3
Médecine
Pertinent
1 clinicien sur 3
CONSENSUS
Non pertinent
1
I - -
1 clinicien sur 3 O I 8
II cliniciens sur 3
2 cliniciens sur 3
10 11
Pertinent
7
Non pertinent
8 15
TABLEAU V : RCparütïon des dossiers divergents seIon L~évaluateur E, vs Ez vs E3 en gtriatrie, dans ks disciplines médicaies et aa totai
Contre (%) Contre (%)
12(41,38)
W w 7 )
2q50)
Consensus Avec (54)
18(62)
Wq3
34(65,38)
Avec ( O h )
Gériatrie 29
Médecine 23
Total 52
TABLEAU VI a): Validité de l'échelle AEP en comparaison du consensus des trois cliniciens experts en g6riatrie
NP=non pertinent PE-ertinent N,,=296
AEP
Prévalence=P =,O4 + 0,024 = 0,065 Niveau du test =Q +,O4 +O ,219 =0,260 Sensibilité = SE=0,04/(0,04+0,024) = O,62 1 Spécificité = SP=û,715/(0,219+0,740)= 0,765
Consensus (cbiciens)
Valeur prédictive positive = VPP=O,04/(0,04+0,219)= O, 155 négative = VPN=O,7 1 S/(O,7 lS+O,O24)= 0,966
Efficience =EFF=,04+,7 15 4,755
I
PE I
i
VN = 0,715 (29) FP = 0,î 19 (65) P' = 0,935 (94)
TABLEAU VI b): VaiiditC de L'tcheiie AEP en comparaison du consensus des trois cliniciens experts pour les autres disciplines médicaies
NP==non pertinent PE=pertinent N,=293
AEP
Prévalence=P =0,078 + O = 0,078 Niveau du test -4 =0,078+ 0,044 4,121 Sensibilité = SE=0,078/(0,078+0) =l,O Spécificité = SP= 0,877/(0,044+0,877)= O,% 1
Valeur prédictive positive = VPW,078/(0,078+0,044)= 0,638 négative = VPN=0,877/(0,877+0)= 1 ,O0
Efficience =EFF=0,078+0,877 =0,955
1 NP
Consensus (cliniciens)
PE
NP
W = 0,078 (23)
FP = 0,044 (13)
PE 1
I
FN = 0,OO (O) P = 0,078 (23)
VN = 0,877 (29) PL = (14,078) (42)
TABLEAU VTI : Raisons d9aàmissions non pertinentes
AEP MD AEP MD 75(100) 12(100) 36(100) 23(100) N (/O) N (%) - N ( O h ) N (Yo)
(A) Interventions diagnostiques eUou thérapeutiques auraient pu être accomplies en ambulatoire.
(B) Le patient nécessite des soins mais P an niveau autre que courte durée
53 (7447) 8 (666) 7 (19,4) 1 (4935)
(C) L'admission est prématuree et/on on note une absence de plm.
1 (1,331 0 (0) 2 (7,7 1 (4935)
@) Le patient n'est pas observant à ses traitements
AEP=Appropriateness Evaluation Protocoi M.D.= Cliniciens experts
FIGURE 1: Relation entre ks besoins pour des services hospitaiïers et les semces reçus
Est-ce que le niveau de soius hospitaIiers fiit reçu? Oui Non
oui Est-ce que le niveau
de soins était nécessaire?
non Utilisation
Réf,: Restuccia, LD, and L. Tracey, The Definition and Measurement of Undmtilization. Working pager, Boston University School of Management HeaIth Pollcy Institute, May 1987,
FIGURE 2: Relation entre les coats hospitaliers, Ia quantitt de seMces reçus et les bCntftces pour Ir sant6
Coût unitair d Effets
Coûts totaux
Quantité de services
Ref: Payne, Pew Mernorial Trust
FIGURE3: Définition des termes et description des résultats pour un sous 6chrntillonnage prospectif selon E.C. Kraemer[60]
AEP
N,=échrurtillon n o n pertinent
PE=perünent
VPP=Valeur prédictive positive=VP/(VP+FP)=VP/Q VPN=Valeur prédictive négative =VN/(VN+FN)=VN/Q' EFF=Efficience = VP+VN--Q-VPP+QIVPN
Note: WF= Weighing Factor OQ= Proportion observée de tests positifs OP= Proportion observée de diagnostics positifs ~(l,O)=Kappa de la sensibilité et de la valeur prédictive négative x(O,O)=Kappa de la spécificité et de la valeur prédictive positive ~(.S,O)=Coefficient d'accord Kappa de Cohen x" 3,84 (seuil de signification à 5%)-6,63 (seuil de signification à 1%)->10,83 (seuil de signincation a O. 1%)
NP VP
FP
PE FN
VN
1 P
P'=t-P
Consensus (cliniciens)
NP
PE I
Evans, RG, Heolih Care Refom: the issue from heUI Poiicy Options, 1993. f4(6): p. 3441.
MSSS, BuUdr'n d'informaîion concernant le système d'informafro~ financière et opdraîionneUe
(SEO), -1997, MSSS-
Angus, DX, et a&, Pour un système de sohs de santé vi'able au Canada, . 1995, Université
d'Ottawa: Ottawa.
RRSSS, Tobfeau de bord: Évolution dr fa production des services hospirolers dans ïa région de
Québec de 19942995 a 1996-2997, . 1998, Régie régionale de 1a santé et des services sociaux:
Québec,
hnmobûiratioar, D.g.d.La.e.d., Évaluation dm écononiès potentieUes réalkabfes dans les CaSGS
rhuirant d'une utilkation accrue de la chirurgrè d'un jour d d'une réductr'on d a dkfab
prkopératoùes, . 1996-
Immobiiïsatioas. D.g.d.l.a.e.d, Évaluatiom du potentiel de r i o rc ion d a durées de s@our dans la
CaSGS sur une buse d'une dude comparative Qudbec-Ontan'o et d'une analyse des dur4es de
séjour au Québec, -1996, MSSS.
Morin, J., Rapport de lir v i d e du 4 mars 1997 à I'KÔpital de l'En fantJPsus, sedeur gkn'afrrè. 1997.
Général, V, Dur& des séjours et pertinence des hospitalkations dans les centres hospitaliers de
soins généraux et spécialisés, -199% Québec,
Santé, G.d.t.s.l.g.ds.d., Faire mieux avec moins: Pour une utilisation eflcace des h6pitaux
canadiens, * 1994, Muiistére de 1a santé.
Anderson, G, S. Sheps, and K. Cardiff, Evduat io~ of Cr-Cam: a utilr'afion management program
of the Greater Hospital Society. Health Policy Research Uni t - Center for hedth services and
policy research, University of British Columbia, 1993.
Commission, H.S.u.a,r., Prefiminary report on base, regional and large communiîy hospifais i n
Saskachewon, ESURC,. 1993: Saskatoon,
Commission, H.S.u.a.r, Preliminary report on small community hospirrrls in Saskatchewan, -1993:
Saskatoon.
Turner, W.E., Ufilizaîion management project: SI-Mary 's Eospifd, Sechelt, BC. 1991.
Anderson, G., SA. Sheps, and K. Cardiff, Hospiid-6ased util&afion management: a cross-Canada
survey. Canadian Medical Association Journal, 1990,143(10): p. 1025-1030.
Brochardt, P.J. and e. COL, Non acute profllës: evaluaiion of physicians' non mute utilizafion of
hospitai resourcesi Quality Review Bulletin, 1981.7: p, 21-26.
Restuccia, J.D., et a&, A comparative analys& of appropriateness of hospiful use Health Affairs,
1984: p- 130-138.
Studnicki, J., The impact of a cybernetr'c conhoï system on inappropriate admksions. QuahW
Review Bulïetin, l984.10: p. 304447.
Siu, AL., et aL, Inapproprr'pte use o f hospitals in a randomized trial of heaIfh Însurarnce plans The
New Enghnd Journal of Medicine, 1986.315(20): p. 1259-1266.
Restuccia, J B , et d, Factors affecting appropriateness o f hospitd utifitotion to iinprove emciency
and competitiveposkrion, Heaith Care Management Review, 1986-12(3): p. 17-27.
Restuccia, J.D., et PL, Assessing the appromeness of hospifai utititotion to itnprove ef frcncy and
competitive position. Health Care Management Re*, 1987.12(3): p. 17-27,
Ludke, RL, a aL, Appropriateness of admissions and dkcharges among readmitted patienîx
EIealth Services Research, 1990.25(3): p. 501-525.
Booth, BM., et aL, Nonocute d ~ y s of care within Deputtment of Veterans Affairs Medical Centers.
Medical Care, 1991.29 suppl A@): p. S51463-
Booth, BAL, et ail, Reïationsh@ between inuppropnnie adnrbsions and days of care: impfications
for utilkation matcagemenl Hospitai adn Healt h Services Administration, 199 1.3 6(3): p. 421437-
Booth, B.M., et a& Nonacute inpatient admksions to Department of Vèterans Affairs Medical
Centers, Medical Care, 1991-29 suppI A(8): p, S40S50.
Winickoff, RN., M.A. Fischer, and BJ. August, Appropriateness of short-stay admissions for
procedures in six veterans affairs hospitak QRB, 1991: p. 386-391.
Winic ko if, RN., et a&, Concurrent application o f the apropriafeness evahation protocol to acute
admissions in department of veterans affairs medical centers; Medical Care, 1991.29(8): p. AS64-
AS77.
Alonso, J., et all, Using Iengtii of stay and inactive days in the hospitai to assess appropriateness of
utilisation in Barcefona, Spain. Journal o f Epidemiology and Commuaity Eeal th, 1996. 50: p.
196-2201.
Baré, ML., et a& Approprialeness of admissions and hospitalizatfrn days in an ucute-care teaching
hospitaL Renie Épid~miologique et Santé publique, 1995.43: p. 328-336.
Barrett, BIT., et aL, Concurrent util'izatioon review and inappropriate kospital stuy: evaïuation of a
program. CIinical Investigative Medicine, 1995- 19(1): p. 28-35.
Bunker, J.P., Variations in hospitat admissions and the appropriateness of care: American
preoccuparions? British Medical Journal, 1990.301: p. 531-532.
Butler, $.S., et al;, Detection and cf(~~sificafion of inappropriate hospiraf s t q - CLinicai Invest
Medecine, 1996.19(4): p. 251-258.
Coast, J., et a&, The hospitat admiksions sfudy in Engfandi are there alternatives to emergenw
hospitaf admission? Journal o f Epidemiology and Community Health, 1995.49: p. 194-199.
Feldstein, P.J., TM. Wickizer, and J.R.C. Wheeler, Private cost containment: fhe efleects of
utifization review programs on health care use and expenditures. New England Journal o f
Medicine, 1988.318(20): p. 1310-1314.
Fellin, G., et a&, Appropriateness of hospital use: an ovewiew of fiafian siudies International
Journal for Quality in Health Care, 1995.7(3): p. 219-225.
Fried, RA., D.S. Main, and BS. Calonge, Appropriateness of Hospital Use by Family Physicians
Journal of the American Board of Family Practice, 1994.7(3): p. 229-235.
Inglis, AL, ef aL, Appropn'rrfeness of Hospital UtZkution: me validi;su and ref i i i l i ty of the
Intensi@Seven-g-Discharge review system in a United Khgdom Acute Hospital Seniirg. Medical
Care, 1995.33(9): p. 952-957-
Lang, T., et a&, Approprr'cteness of admissions: the French experience; International Journll for
Quality in Health Care, 1995. 7(3): p. 233-238.
Lorenzo, S. and R Sunol, An overvi'ew of spanish studies on appropriateness of Aospilal use
International Journal for Quality in Hedth Care, 1995-7(3): p. 213-218.
Mozes, B., et uL, Medical patients assessment protocol: a tool for evaluating the appropriaemess of
utiliung kospitd-stqy doys for acute medicai patients; dmelopmen~ reliabilfty a ~ d applicaû0n~
Amecïcan Journal of Medicai Quaüty, 1996.11(1): p, 18-24,
Smith, C.B., et a& OverutiIizption of Acute-Care Beds UI Vlerans Affairs Hospirak Medicai Care,
1996.34(1): p. 85-96,
Hayes, CB, 2. Johnson, and M. Hynes, Utiîisatioon of kospilal beds by the elderfy - A cohort d y
of admissions to u teuchimg hospifuL Irish Medical Journal, 1995. 88(4): p. 124-126.
Tsang, P. and M.P. Severs, A study of appropriateness of acute geriatric admissions and an
assessment of the appropriateness evaluation protoco& Journai of the Royal College of Physicians
of London, 1995. 29(4): p. 3 11-314.
Pahor, hl., et al,, Trends of the characteristics and appropriateness of admissions io acute geriatric
and medical wards in Ifaly from 1988 through 1993. European Journal of Epidcmilogy, 1996.12:
p. 563-571.
Restuccia, JJ), the Evolution of hospital utilization review methods in the United States.
International Journal for Quaiity in Health Care, 1995.7(3): p. 253-260.
Gertman, PM. and J.D. Restuccia, The approprkieness evaluation protocol: a technique for
assessing unnecessary days of hospitaf car& Medical Care, 1981. XM(8): p. 855-871.
Strumwasser, I., et aL, Reliability and validity of utilization review criteria: appropriateness
evafuation protocol, standardiwd medreview instrument and intense-severirv-discharge criteria
Medical Care, 1990.28(2): p. 95-111.
INTERQUAL, The ISD rr revièw system with adault criteriam North Hampton. Interqual, 1992.
MTERQUAL, Adult ISD criferia and review system, North Hampton, Interqual, 1993,
Associa tes, KM., Managed care appropriateness protocol. 1993,
Ludke, RL., et a&, Pilot study of nonacute ufifization of VAMC in panént services: publication SDR
87-003. Fihal report Washington DC, Department of Veteran Affairs. 1990.
ICA, Lefrnancemenr des soins de santé, . 1996.
Berwick, DM., Quality of healrh care, part 5: Puyment by capitation and the quafïty of cure. New
England Journal of Medicine, 1996.335(16): p. 1227-1231.
Rogers, W.H., et aL, QuaZi'fy o f care before und aper impfementation of the DRG-Basedprospeclive
puyment systenf. Jounal o f the Americvt Medical Association, 1990.264(15): p. 196-1994.
Payne, SM., identr'fiing and nra~~aghg inappropdie hospitaf utilimtion: a poliiy synîhesk Health
Service Ressources, 1987.22(5): p. 709-769,
Demlo, LX., PM. Campbell, and S.S. B t o w ~ , Refr'ability of information abstracted franc patient's
medical recordk Medicd Care, t978.16(2): p. 995-1005.
Donabedian, A, Quafi# messment and monitoring the criteria and standards of qud i . . Health
Administration Press, 1982.2,
Rishpon, S., S. Lubacsh, and LM. Epstein, Relr'obif. of a method determining the necessi& for
hospital doys in Israel. Medical Care, 1986.24(3): p. 279-282.
Wakefieid, DS., et aL, Use of AEP for esii'mating the mental cos& associated with nosocomtal
infection. Medical Care, 1987.25(6): p. 481-488,
Goldman, RL. and e. coll., Vafidity of u t i f i . ion management criteri. for psychi&ry. American
Journal of Psychiatry, 1997.154: p. 349-354.
Kraemer, H.C., ed. Evaluating Medical Te. . 1992, Sage Production Editor: Newbury Park.
181.
Davido, A., et a& Appropriateness of admission in an emergency department: reIiabiIi2y of
assessment and causes of failurc Quality Assurance in Health Care, 1991.3(4): p. 227-234.
Smith, Ha., et aL, Appropriateness of acute medical admissions and letigth of stay. Journal of the
Royal College o f Physicians of London, 1997.3 l(5): p. 527-532.
Werneke, U., et a& Validation of the paediatric appropriateness evaluation protocd in BritrSh
practice Archives o f Disease in Childhood, 1997.77: p, 294-298.
Smith, HX., S. Sheps, and D.S. Matheson, Assessikg the Utilüation of In-patient FuciZities in a
Canadian Pediatric RospitaL Pediatrics, 1993.92(4) : p. 587-593.
Monette, J., et aL, Pertinence des journées d'hospitakations dans un service de gériatrie aiguë:
validation de deux instruments de mesure, -1998, La Société québécoise de gériatrie: Sherbrooke.