Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE...

19
Com/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois par Maurice Coyaud (Communication au Congr@s International de Linguistique math~matique - 5renoble, AoOt 1967 -) On se propose d'abord une rapide revue des travaux sovidtiques et amdricains concernant l'analyse automatique des textes scientifiquss chinois ; une seconde pattie de la communication est consacr@e ~ un projet de classifi- cation nominale (par les particules "num~rales" : measure words, classifiers) l'aide de machine. I. Essai de [email protected] recherches en anal.ys.eautomatique. Dans un premier temps, les recherches ont concern~ l'anaiyse d~pen- dante (ou binaire) des textes chinois : cette anaIyse ~tait effectu~e en fonc- tion de la langue de sortie : l'anglais (travaux de Reifler, Washington), le russe (travaux de Zvonov, 1961). Mais on s'est aper~u qutil ~tait plus rentable et plus int~ressant de consid@rer le probl@me de l'analyse automotique sans tenir compte de la langue de sortie. C'est principalement ces recherches, sur l'analyse~- ~, qui retiendront l'attention (n~anmQins, on tiendra compte des remarques pertinentes de Zvonov, issues de son travail sur l'analyse~ndant.__.~e du chinois, en particulier sur les constructions par encadrement : ramie konstrukcii). Les probl@mes de l'analyse syntaxique du chinois ont dt~ d~finis dans leurs grandes lignes par Voronin (Ig5B), Wang (1963) et Hashimoto (1965). 5elon Voronin, on commence par d~couper la phrase, si e31e est complexe, en propositions simples ; on ~tablit ensuite les groupes syntagmatiques et enfin les fonctions iogiques : sujet et pr~dicat. La phrase complexe est d~compos~e

Transcript of Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE...

Page 1: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Com/P 4/1 967/MC-Grenoble

Section dIAutomatique Documentaire

du

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Analyse et classification automatiques en chinois

par Maurice Coyaud

(Communication au Congr@s International de Linguistique math~matique - 5renoble, AoOt 1967 -)

On se propose d'abord une rapide revue des travaux sovidtiques et amdricains concernant l'analyse automatique des textes scientifiquss chinois ; une seconde pattie de la communication est consacr@e ~ un projet de classifi- cation nominale (par les particules "num~rales" : measure words, classifiers)

l'aide de machine.

I. Essai de [email protected] recherches en anal.ys.e automatique.

Dans un premier temps, les recherches ont concern~ l'anaiyse d~pen- dante (ou binaire) des textes chinois : cette anaIyse ~tait effectu~e en fonc- tion de la langue de sortie : l'anglais (travaux de Reifler, Washington), le russe (travaux de Zvonov, 1961).

Mais on s'est aper~u qutil ~tait plus rentable et plus int~ressant de consid@rer le probl@me de l'analyse automotique sans tenir compte de la langue de sortie. C'est principalement ces recherches, sur l'analyse~- ~ , qui retiendront l'attention (n~anmQins, on tiendra compte des remarques pertinentes de Zvonov, issues de son travail sur l'analyse~ndant.__.~e du chinois, en particulier sur les constructions par encadrement : ramie konstrukcii).

Les probl@mes de l'analyse syntaxique du chinois ont dt~ d~finis dans leurs grandes lignes par Voronin (Ig5B), Wang (1963) et Hashimoto (1965). 5elon Voronin, on commence par d~couper la phrase, si e31e est complexe, en propositions simples ; on ~tablit ensuite les groupes syntagmatiques et enfin les fonctions iogiques : sujet et pr~dicat. La phrase complexe est d~compos~e

Page 2: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

au moyen de bornes formelles comme la ponctuation, certeines conjonctions ; certaines propositions n'ont pas de fronti@ree formellement bien d ~termin~es : per exumple, les pr~positivee (ou d@terminatives d~velopp~es avec d~e : cf. Nikitine, 1965, et le rapport eur la technique Fulcrum de Gervin, 1965), et lee relatives sans mot de relation ; ces derni@res sont de deux sortes : ou bien introduites par des verbes comme penser, (re)conna~tre, etc. ; ou bien, en elles, le mot reli~ au verbe pr@c~dent en qualit~ de compl~ment, sujet invers~ ou pattie nominele du pr~dicat est en m~me tempe le sujet d'un groupe de mots plus ~ioign~. Avant de proc@der @ la synth@se de la treduction en langue de sortie, l'analyse devra specifier le hombre des noms (cat~gorie non obligatoi- re, e% peu frequents en chinois) et le temps des verbes (compte tsnu des cinq aspects du verbs chinois, des verbes modaux et des expressions de temps).

La cat~gorisation en parties du discours joue le rBle essential dane ces operations et on la justifie en d~tail (~erebin 1961 a, Voronin 1961) ; la nature du corpus joue eussi son rBle, et notoirement lee difficult~s introdui-

f s tes par la presence de wl)yan dans les textes de math~matiques, apportant une

~concision qui complique la t~che de l'analyste, puieque le syet@me grammatical w e~ny~nne s'incorpore pas, mais se superpose au syst@me bamhua.

A c@t~ des probl@mes g~n@raux qui font l'objet des az~icles qui vien- nent d1@tre cites, on trouve un nombre appreciable de monogz~phies 6tudiant • notamment :

I) les ambiguit~s de cat~gorie grammstieale (~erebin 1961 b : r~duction de 5 ~ 3 types d'ambiguit~, en raison du passage d'un sMst@me d'analyse d~pen- dante ~ une analyse autonoms ; Nikitina 1966 ; Zvonov 1961 b : ambiguit~s des mots-outils yon g, • y~, ~g, you," __wei)" La r~eolution de ces ambiguit~s est jugde trap difficile par Ez~el et el. qui la supposent rdsolue event le d~marrage de leur technique d'en~iyse syntaxique ;

2) les constructions avec d~e (F~icrum Report, 1965) ;

3) la reconnaissance sutomstique des groupes nominaux (Peng, 1966) ;

4) la recherche du sujet (Nikitina, 1965 : place du sujet ; types de sujets : propositionnel, nominal etc... ; doub!~ du sujet par un pronom ou un nom g~n~ralisant ; sujets homog~nes ; sujets absents ; sujets de subordonn~es de d@tez~nination avec de) ;

5) l'imbrication (Hashimoto, 1956) ;

6) l'interrogation (Elliot, 1965) ;

7) des d~terminants d~finie et ind~finis (Annear , 1965) ;

8) des conjonctions de subordination employees dens les phrases hypoth~tiques, yaoeh~ leurs corr~!ateure ha, %a_t~g.shi, %an~ru~o~o jiashi, - - et

3~u, cal, bi~n, y~ (Coyaud, 1967). tes diff~rents fecteurs d~termin~nt

-2-

Page 3: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

lW~ploi de telle ou telle conjonction sont dtudids. Ii n~sst pas certain que l@emploi de ces conjo~ctions soit dict~ uniquemen% par des faeteurs dlalectaux (par exemple Jxesh~ ~ " 5hans', les compos~s de vzendra~t du S~chusn, y ~ d u tang du Zh~eji~ng) ; on salt d'autre part que j~u s'emploie quand la principals est br~ve, ~ ) quand la principale est longue ; msis los autres crit~res, ddtezminant le choix des corrdlateurs n'ont pas ~t~ ddgeg~s.

2. C_!assification nominsle.

Le chinois contemporain poss~de une cent~ine de particules "num~rales" d~terminant chacune une classe nominele. Le mot "numdrale" est g@nant, car cos psrticules ne s'emploient pas n~cesseirement entre un hombre et le nom, meis aussi entre un d~mons%ratif et le nom ou des adjecti?s pr~cddant ce hem. Ceci di%, nous conserverons le mot "numdrele", qui est traditionnel ("ciassi?icateur" sereit trop g~n~ral). Le nombre des num~rales a ~t~ souvent exag~r~ (plusieurs centaines, pour Zhao Yuanren ou Hockett) meis les inventaizes ne visaient sans doute pas stricte- ment l'~tat de langue du chinois contemporain, Pour le u~.u, Herrfurth (1964) considers que 48 num~rales sent d~usage courant ; un inventaire ?ond~ sur un cor- pus plus large (Coyaud, 1967 b) rel@ve B4 numdrales au sons restreint et I G num,- razes indiquont des capacit~s d'usage ordinaire. Le travail que nous pr~sentons ici aun infarct propre, qui est th~orique ; m~is il a aussi un int~r~t pratique (§ 2.1 ).

2.1. Lee part~qulesnum~rales st ~'.aqa!~se automatiqus.

En linguistique appliqu~e, la classification des noms par lee numdrales a une double importance. D'abord, en p~dagogi8 : il es% indispensable d'ensei- gner avee pr~eislon ~ celui qui veut apprendre le chinois avec quelle(s) numd- tale(s) cheque nom se combine (llignorance de cos comblnaisons est aussi pesante

/que cells du genre des noms en francois ou en sllemend). DIautre pert, en analyse automatique, il est n~cessaire que l'eutomate dispose d'un dictionn~m complet, attribuant ~ cheque nom la (oules) num~rale(s) qui lUl cOrrespond(entj. De tels dictionnaires n'existent encore que de fawon paz~ielle. L'information consistent ~ indiquer los couples num~rales-noms dens le dictionnaire automatique a une double utilit~ :

a) permettre de r~soudre des polys~mies lex~cales ; par exemple y~ ~ g~ yue "un.mois °w c~ y-i 3un ~ue "uno luno",~ no different quo per i~ pnrtlcule nu- mdr~e, .~ s'appliquant au mols, et i ~ l'astre. Le mot ~ue est homographs et homophone.

b) pez~nettre de rdsoudre des ambiguit~s de ca%~gories grammaticales. Lee paz~cicules num~rales sent pour la plupart des homographes pouvant souvent forte%Jenner comme noms st p~?ois comme verbes (d~i "emporter", jua_~n"enrouler", etc.). Un essai d'dtablissement ~utomatique des syntagmes nomineux (avec

-3-

Page 4: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

peiJ¢iciJ&eiil HOm~raies~ Hdcessai~ement) ~ ~t~ f~it par Peng (1966).

on portrait ejouter ~ ces deux rubrlqUes une tzoisi~me) repr~sn~ent uHchamp dldtudes encore ±nexpZor~ @ Z'utilisation de 1~biaesification nomi- n~le en tent qua groupes d'afflni~es~mantiques i pe~mettant de choisir entre p~sieUzs ~o¢=diations ~Coep~eblss d~un point de vue purement grammatical (I).

' ' ~ ; ' • ' i

Ltdtude pr~llm-naire eu proj~t esquiss~ ci-dessbUe ~a~t llobjet diun rappoz~ d~tei11~ (Coyaud, 1967 b) dent nous nous eonten~erons Ici de ddvelopper les implications dane la perspective dtun traitement par machine. Le probl&me consiste ~ ~tablir avec d~tail et precision la clcssificetion dee name en chl- hoist ~ itaide des paz~icules numdrales. En particulier ii slagit de dresser la liste des ensembles disjoints, ceile des ensembles conjoints# ddte=miner e~ac- tmment lee ~l~ments eppartenant ~ chacun de ces ensembles ~ et en paz~icullez 6teblir la lists dos ~l~ments appaz~enant eux zones d~inte~seotion entre en- sembles prls deuM ~ deUx, et n ~ n. L~ t~ehu est assez ~eneid~zable pour Justi- fier line aide mdcaniqbe, si llon se propose effectivement de classer environ 3~000 ~oms, Nous evens entreprls ie travail ~ in main pour environ 500 hems. Nous do~nerons la physionomie gdndr~le de Is ~lessificetion tells qulelle apparait & llissue de ce travsii, Nous he ~OUS sommes pas limitds ~ une pers- pective synchronique (description du syst@me clessificstoire des hems du chino~ contemporain | C C ) i le probl~me de l!~voiution de ce systems est important. On re1~ve en effet peu de num~reles e~ ehinois archa¢que (cf. Jaxontov et Hua~ng Z~ijJn) i par centre, en chinois ~ncien (T.A) de le pdriode 200.600 de notre ~re, Lzu Shiru a pu relever 141 num~rales propres et 54 num~rales axpriment des capecitds (sa~e ~r~ r~uz outant des unitds de mesure codifi~es, qui ne nous intdressent pes ici). Fn ug~yu ou chinois contemporain (~ partir de 1920 environ), notre inventaire comprend 100 numdrales (84 propres et 15 de capa- CitY): Lee deux listes d~ num~raIes, pour le CA et le CC, sent donndes en annexe. Pour le CA, nous n~vons retenu qua les 141 numdraZes eu sans pzopre du mot, qui seront comps=des ~ux 64 numd=ales propres du CC pour ce qui eat ~_ Ia classification des noms qu'elles d~te~minent. Les 141 du CA n~incluent pas routes lea B4 du CC. Ces deux ensembles sent en intersection. Les diffdrences individuelles sent donndes dane notre rapport ddtailld. Indiquane ici simple. merit que sur les 141 du CA, 80 n'apparaissent pea en CC ; inversement, su¢ les 84 du CC, 24 n'~t~ient pas ettestdes dens les corpus de CA compi1~s par Li~ Sh~=~ ~.

(i) Pour une utilisetlon dlun r~seau d'affinit~s sdmantiques en analyse auto- matique de taxies fr~n~ais, c?. Coyaud, Siot-Decsuvi].le, Uanalyse automa- tique des documents, Houton, Paris, 196T~

J

Page 5: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Les ensembles s imp les d i s j o i n t s , au nombre d~11 ~ son t d 6 f ~ n i s par les num~r~les : fe~ g~, "'~ ~ ~ . ~ - .v ~/ - - j~an 2 i kong~ l~an, "" - - nzu, p~, CL~ , ~a, went ~ ~V Chacun des 130 a u t r e s e~sembles es t en intersection avec au moins un ensem- b l e de ee groupe. I1 y a q u a t r e groupes d~ensembles d i s j o i n t s parml ees 130 ( l l ~ l e m e n t commun es t i n d i q u e apt@s) :

/

a) b i~ng 1, f u 2 : ~ v e n t e i l

b ) . \ c heng~ ~ g , k'e t u n i t ~ s de temps

e) j~1~ j~1 = re:set d) t o u s l e s 123 mes ten ts ; Le diagramme donn~ en annexe c o n t i e n t ces

ensembles. Une seu le i n t e r s e c t i o n e e ta i n d i q u e e ~ cheque l o i s ( s f i n d l 6 v i - t a r l i e n e o m b r e m e n t ) . B ien d~au t res i n t e r s e c t i o n s son t a t t e s t e e s . Par example , nous n~en svons donne qu~une seu le pour g~, a l o r s queen CA~ d~epr~s l e s examples de LiG \ " Shzr'!, l~ensemble defini per g~ est en intersection avec quinze autres ensembles, definis par les numerales suivantes (l~l~ment Com-

mun est donn~ apr~s) :

sing, yua=n, jie, wei I, ran, --t°/u : humains

fa, jXuu 2, zhi 3 : fl@cha

sh , b , arbres

x : s t a t u e de d i v i n i t ~ zuo

2.22. Relations entre classes nominales en CC.

En CC (ugly) les r~sultets fournis par notre enqu~te donnent 19 clas-

ses disjointes et 80 classes en intersection, dont lea el~ments forment un graphe connexe (volt le second diagramme). Ltensemble defini par ~ est en intersection avec 25 ensembles (ces intersections ne sont pas toutes indi-

qu~es dens le diagram~e), d~finis par les numerales suivantes (les 61~ments co,~uns sont donnes dans Coyaud 196Y b) : b__~, b~u, ehu~ng 2, ~ die'g, eg~n,

, k uaz, l z a n g , mien, m i ~ , "~ pzan, tzeo, to'u, we3. 1 , y ua___nn 1 , zh~i 3, zh jng , z ho~ng, z~_.~o.

2.23. Le~.

Uimportance exacte du eh~ est difficile ~ ~valuer d'apr~s ce son- dage sur le classification de 500 noms & paine, Signalons que me i en CA semble jouer le rele de ~ en CC. L'augment~tion du nombre des substitutions par g~ de num~rales du CA au CC ntest pas ~norms, elles sont pessEes de 15

25. Mais 6 num~rales seulement sont identiques dans les groupes des 15 CA et 25 CC.

- 5-

f

Page 6: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

2.24. C~assification ~ itaide de machine.

Les r~sultats donn~s ci-dessus ont ~t~ obtenus @ le main, su terme

d'une ~tude ingrate et incompl~taportant saulement sur los classes d'ap- partenance de 500 noms environ en CA et en CC. A~in d'obtenir des r~sultets

exempts d'erreurs (ce qua ne pr~tendent pas ~tre ceux qui ont ~t~ pr~sent~s ci-dessus) et portent sur un ~chantillon important de noms (environ 3.000),

on envisage une aide m~canique. Le but recherch~ est it~tablissement correct

des classifications de nomsen CA et en CC : classes disjointcs, classes s~-

cantes, ~num~retion exhaustive des ~l~ments de cheque clesse et de cheque zone dlintersection 2 ~ 2 et n & n. C1est seulement ~ l'issue de ce travail

que l'on pourra avoir une idle Precise de la classification des noms per les num6rales en chinois, et de son ~volution diachroniquG (en perticulier de l'~volution de le num~rale g~n6rele ~ : le ~). En outre, le programme sere assez g~n~ral pour permettre une ~tude ~n~iogue des classifications

nomineZes dans d'autres langues ~ particules num~r~les, comme le laotian, le vietnamien, le thai, le maleis (Herrfurth), le japonais et ie maya du Yucatan (cf. la 2@me pattie de notre bibliographie). Ce ntest qutalors que des comparaisons pr~cises (et non plus vagues comma toutes callas qui oot ~t~ present,as jusqu'& present) pourront 8tre antreprisas.

N.B. Les numSros de r~f~renc~ de l'index des num~reles du CA donn~ en annexe

se rapportent aux paragraphes de notre rapport d~ ta i l l ~ (2967 b), r e -

produisant pour le CA l ' o r d r e de presentat ion de Lzu 5hzru (1965, p. 76 ~ 223).

Page 7: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Z._,

,,,.t.

1

I [

t .

d<,

{

1

...1£ \ i

\ l

L! I ' b I

J

~ - ~ " ,~" ,.,~ / \

., .~//\\'<~,~ ,-,.k 7

-t- i

J

Page 8: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

-L

i

I

/,I

'+ i / : <~ '? ~- ~@ I ".~ \ f$,,, =i

\ \~>< -z . \\'~/,,~,) \ i: .~I , ~,~ ~.~----].4

\\ ,' 1

. I ,~ ~ , ~ ] / ~ '.~ I ~ LI

' . "1 "l" I ~ I t # I .----~ I ",~ .~ x\ i:~r-\,~ x .. ,,

. . . ~ _ . # / > f ,~ ~. ~! , p ,_) \ I / ~ ~ - ' ~ , . ~ ~ . . ~ "I , ~ .j

.._ " ~ . 1 i \ ~ " " " , \ I - / " ~ - - ~ 1/ I '> I X I ~ / ,,,

.,i: \ " I <..t :,,l

, 4 t / \ 'f - - ' ~ "

~+ __.~ -=~" I '-~ \-~ I - I - '

I'+..\ ",! ,~. l~X.+

- ~ °

Page 9: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Index des num~rales du chinois ancien

be~ ("cent chars")

b~n bi~n b~ng 1 ("manche")

b~ng 2 ("pSt6")

1.12 K

1.12 B

.~,~ 1.13 E

D ~ 1.12 C

1 . 1 3 .

b~ ("jonque") ~

ceng

cha~ng ~

chug

cho~g

ch~

chuang 2 ("drapeau")

co~g ~. dao

d£ .J

dian ~.

di~ ', ~troi~ ~hamps) ~=~

di~ 2 (c le f de la pl~nch ~ gO)

d:

duSn 1 (c le f - l i ) ~

du~n 2 ~

1.13 I

1.22 g

1.12 K

1.13 E

*.12 d

1.13 L

1.22 C

1.12 J

1.12 L

1.12 D

1.12 E

1.22 A

1.12 I

1.12 K

1.12 F

1.12 G

1.12 J

1.12 J

1.13 C

1.12 C

1.12 H

1.12 N

Page 10: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

f" 1 ("surface")

du~o

f;

f~ I (clef des plumes)

f~'n

f~ng

fang

f~

fe~g

fu~2 (clef ds la re=in)

f~

g~n

g~

gEn

g~g

g~

guan

h~

ha~ng

h~ I /

hengsha

h~

. 4 Jz

j l

Jza . . ~ j ~a

ozan

j zan

. . . % j zan 2 ( " v e r r o u " ) o . - j z e

/

j i e 1 ( " v e r s i f i e r " , c l e f de 1 ~ homme)

k~

4"

2

$,]

i',1

- ~I@ -

1.12 I

1.13 K

1.21 B

1.12 N

1.13 J

1.13 B

1.13 A

1.12 H

1.13 F

1.12 I

1.22 B

1.13 K

1.11

1.12 B

1.13 L

1.12 G

I .13 D

1.13 F

1.22 E

1.22 B

1.13 M

1.22 D

1.13 M

1.12 J

1.13 B

1.22 D

1.21 B

1.12 H

1.13 E

1.12 H

1.13 M

1.12 J

1.13 M

Page 11: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

.°k j , e

j:]ng

j~ I ("parole")

ju 2 ("pr@parer ~' )

juan

k~

kE I (clef de la fcuilla)

k~3 (c~r~ale et boisseau)

k&

ko~g

ko~

ku~i

l&ang

Zing

ziJ

m~'n ,\

mlan .i

m&ng

ni~ p$

plan

plan

pin

pS

p5 ql

- 11

/~ I .11

1.12 B

/~ 1.13 E

~, 1.22 B

1.13 E

t,,~ 1.13 M

-'~,a~")~ 1.12 G

~'~i" 1.12 K

1.13 L

.,~ 1.13 H

~0 1.12 A

"I;~'~ 1.12 G

1.12 K

~ 1.12 G

1.13 I, 1.21 A

1.22 E

42 112c :~ 1.12 K I ;ll.~

~ 1.12 F

.~, 1.13 R

~ . . 1.11

I"] 1.12 K

~ 1.12 I

~.~ 1.12 E

~ 1.13 r,G

1.13 I k~

1.13 E

1.12 G

1.12 K

~ 1.13 H

~' 1.12 I

I .13 M

Page 12: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

qi~ng q~ I ("r~gion")

q~ 2 (,,tordre")

qO 3 ("corps")

qJn r~'n sh'~ sh~n

sh~ng

sho~ I ("t~tB") •

sh~

sh~ang

s~ ~.

S U l

su% ta

tzao

t~ng t ~ g

wez I ("rang")

w~ei 2 ("odsur")

w~ /

X1

x~

xu'an

1.12 A

~. 1.12 L

I .13 E

,,~ I .22 A

,~, 1.12 M

~,~ 1.13 C

1.13 M

1.12 I

1.12 M

1.13 E

~.~ 1.12 M

1.21 A

1.13 I

1.21 B

1.12 L

~P- 1.22 B

,~ 1.12 B

1.12 B

~ 1.12 N

1.12 A

;,~ 1.12 G

JC~..- 1.13 A

v ~ 1.13 B

~,, 1.13 H

~t~ 1.12 ,~

~J~.~ 1.22 C

j ~ 1.12 C

.~: I .21 B

~. 1.12 I

Page 13: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

d yuan 1 (pour les personnes)

=

yua~n 2 ( " o u r l ~ " )

z h ~ g ~ ("bander un arc")

zh~'ng 2 ( " te~ te " )

zh~n

zh~ 1 (clef du bois)

zh r 2

zh i 3 ("oisoau")

zh~ 1 ( "p~p ier " )

zh~ 2 ( " do i g t " )

zh~

zh~ng

zh6u

zhO

zh~n

z~

z~n

z~o

1.13 A

1.13 H

1.12 1

1.13 E

1.12 N

1.12 B

112 B

1 12 F

1 ,12 R

1 ,13 H

1 ,13 E

1 ,12 K

1 ,12 C

1 ,12 B

1.12 J

1.12 G

1.13 H

1.12 0

Page 14: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Liste des Num~reles d~ chinois contemporain

b~n ~ fa~ 2 "retourner"

bEng ~ fe~g b~o ~b f~1 "su=face" '~

b~ QL g~

bi~n .~ g~n ~

guan

chang ~;~ " guan

ch~ E# hang ~ ch~ ~ h~a % ~h~ ~ he" 2 ,,~o~o,,

churn # h~

d~i 1 "ceintura" ~ J±e

da~o ~ j i a~ l "part" 4~ de~g k.~ jie 2 "noeud de bambou"

di ~ ju''1 "parole" '~

di~n ~ jua~n

d~ng ~ .ke 1 (clef de la feuille) ~

du-an 2 "morceau" ~ k% 2 (clef du bois)

d~i ~ ko~ ¢/

d~i ~,~ ku~i ~ d~n ~ k~n ~@

- 4 4 -

Page 15: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

m~ ~'~ mien \~ rn~ng ~n

p~..

pi~n pi~n

. J pzng ~-~ qu n sh~n ).~ eh~'n ~ eh~'ng ~.

sh~u I "t~te"

sh~u 2 "main" ehuang ~l~

tiao

tlng tc~ng ~

~n

wel

~an ~ z~ ~c

~h~n zhang 1 "bander un a:c" ~-~

zh~n ~_.i~ zh~. 2 ~ zh~ 3 zh~ng zhJ ~.

zhu'~ng 7 ~

z~o ~

Page 16: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Bibliogrephie

1. Analyse syntaMique! 1 )

Annear, 5.5.- (1965) English and Mandarin Chinese : Definite and Indefinite Determiners and Modifying Clause Structures, POLA 11, (p 1-55), Ohio State Univ.

Coyaud, M.- (1967a) Lee phrases hypothdtiquee an chlnois contemporain (Probl~mes de m6thode}. A parasite dens Hommage A. Martinet. (A. Juilland sd.)

~erebin, M.E.- (1961a)

E l l io t , D.E.- (1965) Interrogation in English and Mandarin Chinese, POLA 11 ( p 56-11T), Ohio 5rate Univ.

Ertel, L.L., Ga~vin, P.L., Pang, F.L.L., Reitz, G.- (1965i Fulcrum technique for Chinese. English Machine Translation. The Bunker Ramo Corp. Canoga Park, California.

5truktura i xecakt~- elov n ika dlja nezavisimogo analiza kitajskogo ~eksta. ITHiVT, Sbornik statjei, p 173 sq.

V (1961b) 0 razresanii konvereionnoj omonimii pri nezavisimom

analize kitajskogo tekste, ITHiVT, p 180 sq.

Heshimoto, A.Y.- (1965) A Condensed Account of Syntactic Analysis of Mandecin. POLA 10, (p 1-27), Ohio State Univ.

(1966) Embedding Structures in Mandarin, POLA 12, Ohio State Univ.

Li, K. P.- (1964)

Nikitina, T.N.- (1965)

(~966)

Autometic Recognition of Mandarin Monosyllable. POLA 9, Ohio State Univ,

V WV Obmabotke podlezascego pri HP s kitejskogo jezyka. NTI, 10- 1965 p 37-40

V V V Grammaticeskaja neodnoznacnoet I pri avtomaticeskom perevode s ~itajskogo jazyka na russkij. NTI, 2- 1966 p 30-33

Pang, F.C.C.- (1966) A Structural Recognition Routine for the Noun Phrases of 5tankard Chinesej in Computation in Linguistics, (p 207- 251), Garvin ed. Indiana Univ. Press.

Page 17: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Voronin~ V.A.- (19G1)

Wang, S.Y.- (1963)

Zvonov, A.A.- (1961a)

{1961b)

Sistema nezavisimogo konfiguracionnogo analiza V~

kitajskogo teksta pri maaznnom perevode, ITMiVT, p 135 eq.

Some Syntactic Rules in Mandarin, POLA 3, (p 32-53), Ohio State Univ.

V V. Analiz ramocnyx konstrukeij pri binarnom mas~nnom perevode s kitejskogo jazyka na russkij. ITMiVT, p 349 sq.

V AnaZiz sluzebnyx slov pri binarnom masinnom perevode s kitajskogo jazyka na ruaskij. ITMiVT, p 360 sq.

note (I) - Lee r~f~rences de ~erebin, Voronin e% Zvonov aont publi~es dens lea

"Travaux de itlnstitut de M~canique de precision st de Technique du

calcul;Acad~mie des Sciences, 2e ed. Moscou, 1961 (ITMiVT).

Page 18: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

2. Clas@ifica%ion nominele.

Num~rales du chinois.

Coyaud, M.- (1967b) Classification nominaie en chinois tles particules num~rales. Rap/P.2/SAD Polycopi6, CNRS,SAD, Paris.

Bragunov.- (1958) X~and~i " u u ~ / ... • hanyu yufa yanjzd , P~kin.

Herrfurth, H.- (1964) Die Klassifikationsaffixe im Chinesischen~ Beitr~ge zum Problem des Wortes im Chinesischen If, p 1-43. Akademie Verlag, Berlin,

Huang Z~ijJn.- ~1964) Cono jiawen, jinwen liangcide yingyong, kaocha hanyu izangc~de qlyuan yu fazhan. Zhongguo yuwen n~ 6, p 432-441.

Jaxontov, S.Eo- (1965) Drevnekitajskij jazyk. ANSSSR, Moscou.

Ling quanfang.- (1955) Yong yu rende ge t i l i angc i .Yuyan zhishiv n 2 " 6 ,

5h i ru . - (1965) Wei Jin N~n ~ / " ~ ~ / ' ~ - / Bei chao liangclde yanBlu. Zhonghua shuju. P6kin.

Liu 5 sheng.- (1957) Ten liangci.~yan xuexi, ng 10.

Wang L1 (Wang L iaoy i ) . - (1955) Yo~guan ran Ju he xingweide xuc i . Yu wen xuexl co~gsh~, Zh~nggu~qingni~nch5b~nsh~, P~kin.

Zh~ng B~nkang.- (1959) 5hiw~ / " ~ ~ " he l i angc i , Yuyan zh~sh[, n~ 8.

Page 19: Com/P 4/1 967/MC-GrenobleCom/P 4/1 967/MC-Grenoble Section dIAutomatique Documentaire du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Analyse et classification automatiques en chinois

Num~rales d t aut~ep !anques.

Oeloustai, R.- (1914) Des d~terminati fs en ennamite, BEFO, XlV, 5.

Emenau ~ M.B.- (1951) Studies in Vietnamese Grammar. Oniv. of Ca l i f . Pressp Berkeley.

Haas, R.R.' (1942) The use of numeral c l ass i f i e r s in Thai, Languegep XVIII~ p 201 sq.

Haguonh~uer,Ch.= (1951) Rorphologie du japonais moderne, Kl incksieck, Paris.

Hoepitaliez~ JoJ.- (1937) 8rammaire laotienne, Imprimerie Nationele, Parisj

Koutsoudae, A.- (1966) Writing Transformational Grammars. Mc Graw-Hill~ New-York,

Naganuma, N.- (1951) Basic Japanese Course, Tokyo.