Segmentation temporelle et spatiale de données agricoles

23
HAL Id: inria-00107596 https://hal.inria.fr/inria-00107596 Submitted on 19 Oct 2006 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Segmentation temporelle et spatiale de données agricoles Jean-François Mari, Florence Le Ber, Marc Benoît To cite this version: Jean-François Mari, Florence Le Ber, Marc Benoît. Segmentation temporelle et spatiale de données agricoles. Actes des 6èmes Journées Cassini 2002, GDR SIGMA, Sep 2002, Presqu’Île de Crozon, France, pp.251-272. inria-00107596

Transcript of Segmentation temporelle et spatiale de données agricoles

Page 1: Segmentation temporelle et spatiale de données agricoles

HAL Id: inria-00107596https://hal.inria.fr/inria-00107596

Submitted on 19 Oct 2006

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, estdestinée au dépôt et à la diffusion de documentsscientifiques de niveau recherche, publiés ou non,émanant des établissements d’enseignement et derecherche français ou étrangers, des laboratoirespublics ou privés.

Segmentation temporelle et spatiale de données agricolesJean-François Mari, Florence Le Ber, Marc Benoît

To cite this version:Jean-François Mari, Florence Le Ber, Marc Benoît. Segmentation temporelle et spatiale de donnéesagricoles. Actes des 6èmes Journées Cassini 2002, GDR SIGMA, Sep 2002, Presqu’Île de Crozon,France, pp.251-272. �inria-00107596�

Page 2: Segmentation temporelle et spatiale de données agricoles

Segmentationtemporelle et spatialede donnéesagricoles

Jean-FrançoisMari * — FlorenceLe Ber * — Mar c Benoît **

* LORIA: UMR 7503et Inria-Lorraine, B.P. 239,54506Vandœuvre-lès-Nancy

[email protected], [email protected]** INRASAD,Domainedu Joly, 88400Mirecourt

[email protected]

RÉSUMÉ. Nousprésentonslesrésultatsd’un travail defouille dedonnéeseffectuépar desagro-nomeset desinformaticienspour extraire desbasesdedonnéesagricolesTer-Uti desinforma-tionssur lessuccessionsdeculturespratiquéesdansunerégion.Nousavonsutilisé pour celadesmodèlesstochastiquesdéveloppéspour l’analysede séquenceset d’images : les modèlesdeMarkov cachés.Cesmodèlespermettentdereprésenterdesobservationstemporellesetspa-tialescommedessuccessionsd’étatsoù lestransitionsentreétatsdépendent,suivantl’ordredumodèle, del’état courant et des � étatsvoisins.Nousprésentonsuneméthodedeclassificationspatio-temporellequi permetdedécouperunerégionsur la basedesévolutionsdessuccessionsde culturesqui y sontpratiquéesen faisantapparaître desclasseshomogènesde successionsdecultures.Deuxexemplesillustrentnotre travail : lescasdela LorraineetdeMidi-Pyrénées.

ABSTRACT. In theareaof dataminingof agricultural databases,thispaperpresentssomeresultsin segmentationand classificationof spatio-temporal data usinghigh-order Hidden MarkovModels(HMM). Thesemodelsare capableto mapspatial and temporal observationsonto asequenceof statesin which the transitionsbetweenthestatesdependon the � previousstatesaccording to theorder of theMarkov chain. They havebeenappliedon spatial and temporaldataconcerninglanduse, namedTer-Uti data,in ordertofindagricultural landuseregularities.We showon variousexamplesthat theHMMs are powerfultoolsfor temporal andspatialdatamining.

MOTS-CLÉS: HMM, donnéesTer-Uti, utilisation du territoire, fouille de données,segmentationspatio-temporelle.

KEYWORDS:HMM, Ter-Uti data,datamining, land use, spatio-temporal segmentation.

Actesdes6��������

JournéesCASSINI2002,pages251à 272

Page 3: Segmentation temporelle et spatiale de données agricoles

252 Actesdes6��������

JournéesCASSINI 2002

Intr oduction

L’occupationdu territoireagricolechanged’annéesenannées,enraisondedeuxfaits majeurs,la libération continuede territoirespar la disparitiond’exploitationsagricoleset l’évolution dessystèmesdeproduction.Cetteévolution setraduitprinci-palementdansle changementdessuccessionsdecultures,par l’introduction denou-vellescultures,le raccourcissementdesrotations,la priseencomptede la réglemen-tationdela politiqueagricolecommune,etc.

L’étudedecessuccessionsestun enjeupourl’agronomiecar:

– la connaissancedessuccessionset deleur évolution estun outil pour la gestiondecertainesressourcesdel’agriculture(parexemplel’irrigation) ;

– c’estégalementunmoyendeprévoir etdeprévenirdeseffetsenvironnementauxmajeurstelsquela pollution desressourceseneauet la structurationdespaysages;

– à un niveauplusprospectif,cetteconnaissanceestutile pouranalyserlesdyna-miquesencoursdansl’agriculture.

Le choix d’unesuccessionparun agriculteurresteun phénomènemal connu.Cechoix est révélateurdu métierd’agriculteuret intègrede nombreuxfacteurs: datesde récolteet d’implantationdescultures,état laissépar unecultureaprèsla récolte,organisationdechantiersentreparcelles,etc.

Différentsmoyensexistent cependantpour connaîtreles successionspratiquéesdansunerégion: enquêtesdeterrainchezlesagriculteurs,recueilsd’expertiseauprèsdetechniciensagricolesou exploitationdesbasesdedonnées,constituéesenparticu-lier par lesservicesstatistiquesdu ministèredel’agriculture.C’estcederniermoyenquenousavonsétudié.Nousavonseneffet développéuneméthodepourexploiter labasededonnéesTer-Uti, qui estunrecueilsystématiquedepuis20ansdesoccupationsdu sol surun ensembledepointsdu territoire français[LED 92]. Notrebut estd’unepartde définir desrégionshomogènespour les successionsculturales(segmentationspatiale),d’autrepart de mettreà jour les successionsdominanteset de cernerleursévolutionsà différenteséchelles(segmentationtemporelle).

Cet article présentela méthodequenousavonsdéveloppéeconjointementet quis’inscrit dansun processusde fouille dedonnéesentreinformaticiens”fouilleurs” etagronomes”experts” [MAR 00]. Nousavonsutilisé desalgorithmesprécédemmentdéveloppéspour la reconnaissancede la parolequenousavonsadaptésauxdonnéesTer-Uti. Nousavonsdéveloppédesoutilspourmanipulerlesdonnéesetvisualiserlesrésultatsenfonctiondesdemandesdesagronomesqui lesont ensuitepris enmainetutiliséspour leur recherche.Desrésultatssontprésentéssur la régionLorraine,qui aserviderégiontest,et surla régionMidi-Pyrénéesoù notreméthodeestutiliséedansle cadred’un projetd’aideà la gestiondel’irrigation.

Le plan de l’article estle suivant : la partie1 présentele principede la méthodeet lesmodèlesthéoriquesutilisés,lesmodèlesdeMarkov cachés.La partie2 présenteles donnéesTer-Uti. La partie3 décrit les outils mis au point pour la segmentation

Page 4: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 253

temporelleet lesrésultatsobtenussur lesdonnéeslorraines.La partie4 décrit la mé-thodeutiliséepour la segmentationspatialeet les résultatsobtenusenLorraineet enMidi-Pyrénées.La dernièrepartieestunediscussion.

1. La méthodeutilisée : fouille de donnéespar modèlesde Mark ov cachés

Unedesfonctionsdela fouille dedonnéesestd’élaborerdesindicesconciset ex-purgésdu bruit de l’application qui permettentà un analysted’avoir unevue claired’un tableaudenombres.A partir decettevue,l’analystepeutextrairequelquesélé-mentsde connaissance,débuter un raisonnementet formuler d’autresexpérimenta-tionssusceptiblesdecomplétersaconnaissancedu domaine.

La classificationresteunedesapprochesprincipalesen fouille dedonnées.Danscetteoptique,nousadoptonsuneapprochebayésienne.Afin despécifieret construiredesinterfacesdevisualisationderésultats,nousutilisonsdesindicesélaborésà partirdela probabilitéa posteriorid’effectuerunclassementunefois lesdonnéesobservées.

LesmodèlesdeMarkov cachés(HMM commeHiddenMarkov Model) permettentdecalculercetteprobabilitédansle casoù lesdonnéesont unedimensiontemporelleet/ouspatiale.Ils serontprésentésquelqueslignesplusbasdansla section1.2.

Nousallonsenvisagerdansla suitedeuxfamillesde tableauxde donnéesnumé-riquesqu’il faudraclasserà l’aide de HMM : les suitestemporellesd’observationscommelesculturesrelevéesdansunpointprécis– unsite– du territoireaufil desanset leschampsdeMarkov fondéssur la notiondevoisinagespatialcommela réparti-tion spatialedesculturessur un territoireuneannéedonnée.Nousverronscommentles hypothèsesmarkoviennespermettentde traiter dansun cadremathématiqueélé-gantla variabilitétemporelleet spatialedesformesétudiéeset commentla variabilitétemporelled’un sitepeutinfluencersacatégorisationspatiale.

L’analysedeschangementsd’occupationdessolsestun thèmede rechercheac-tuel enagronomie.Nousl’abordonsavecuneméthodedeclassificationqui a fait sespreuvesen reconnaissancede la paroleet en génétique.La poursuitede ce travailconsisteraen une évaluationcomplèteainsi qu’une comparaisonde cetteapprocheauxapprochesutiliséesenanalysedeschangementsd’occupationdessols[KIE 93].

1.1. ModèlesdeMarkov cachéspour la classification

Dansnotredomaine,les sitesont descaractéristiquespropres– l’occupationdela parcellecontenantce site – qui permettentde les regrouperen zoneshomogènesmaisaussis’inscriventdansuneévolution temporellequi peutconstitueruncritèredeclassificationsupplémentaire.Le classementd’un point dépendautantdesescaracté-ristiquesauxinstants

,���

. . .quedecellesdesesvoisinsspatiaux.Poursimplifierla modélisation,nousacceptonsl’hypothèsemarkoviennequi stipuleque,surunepar-celle, la règledesuccessionnedépendquede l’occupationactuellede la parcelleet

Page 5: Segmentation temporelle et spatiale de données agricoles

254 Actesdes6��������

JournéesCASSINI 2002

del’occupationdesdeuxannéesprécédentesainsiquedesoccupationsdespointsvoi-sins.Ceshypothèsesnouspermettentd’utiliser lesmodèlesdeMarkov cachésd’ordreun et deux(HMM1 et HMM2). Lesexpertsagronomesacceptentfacilementceshy-pothèses.

1.2. Définition d’un HMM

Les modèlesde Markov cachésdérivent deschaînesde Markov. Une chaînedeMarkov définit un seulprocessusstochastique: elle possèdeun ensembled’états–parexemplelesculturessuccessivesd’uneparcelle– directementobservables.Dansun HMM, une observation n’est pasuniquementassociéeà un état.Les étatssontdéfiniscommedesdensitésdeprobabilitésurl’ensembledesobservations.Dansnotreapplication,onconsidèreainsiquela répartition– c.-à-d.la densité– desculturesdansunerégiondonnéeévolue selonun processusde Markov. La répartitionà un pasdetempsdonnéne dépendquede la répartitionaux pasprécédentssuivant l’ordre dumodèle.On supposeainsiquel’observationd’unecultureuneannéedonnéesuruneparcellesuit la loi définiesurl’état atteintcetteannéeparla chaînedeMarkov.

� ��� � ��� ���état1 état2 état3

prairies 0.029 prairies 0.029 prairies 0.029blé 0.029 blé 0.029 blé 0.029colza 0.029 colza 0.029 colza 0.029maïs 0.029 maïs 0.029 maïs 0.029jachères 0.029 jachères 0.029 jachères 0.029. . . . . . . . .

Figure 1. HMM effectuantunesegmentationentrois périodes.Lesétatscachéssontdénotés1, 2 et3

Le HMM permetdereprésenterdeuxprocessusstochastiques,le premiergouver-nantle second[BAK 74] :

– le premierprocessusestdéfini surun ensembled’étatset cachépourun obser-vateur. C’estunechaînedeMarkov d’ordreun ou deux.

– le deuxièmeprocessusestqualifiédevisible. Il émetuneobservationà chaquepasdetempsenfonctiondesdensitésdeprobabilitédéfiniessurchacundesétatsparle processuscaché.

Dansl’exempledonnéFig.1, lesétatscachéssontdénotés1,2 et3. Ils représententchacununedistribution uniformede cultures.Ce modèlepeutsimulerla productiond’une région.A chaquepasde temps,la chaînede Markov changed’étatsen fonc-tion destransitionsautoriséeset produit uneoccupationdu sol : prairies,blé, colza,jachères,. . .enfonctiondela densitéreprésentantl’état visité.

Page 6: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 255

Finalement,un modèledeMarkov cachéestdéfiniparla donnéede:

– ��������������� �"!#�%$&$%$&���"'(��)�* , un ensemblefini comprenant+-, �états,dontun

étatinitial � etun étatfinal ) ;

– . la matricedonnantlesprobabilitésdetransitionentreétats:

- ./��0214365�7 pourun modèled’ordre1 (HMM1) avecla contrainte:8 5 1 395 � �;:�<- ./��021 365�= 7 pourun modèled’ordre2 (HMM2), avecla contrainte:8 = 14365�=>� �-:�< �@?

– A 3 0B$67 leslois desdensitésassociéesauxétats� 3 .La matrice . estinitialiséeavecun ensembledevaleursqui permettentdedéfinir latopologiedu graphedestransitionsentreétats: quellessontlestransitionsautorisées,aller simple( 14395DCFE , 1G5H3I�JE ), aller-retour( 14395DCFEK�L1#5H3MCFE ), bouclage( 143N3PO�JE ),etc.Parexemple,le HMM1 décritparla figure1 possèdepourmatricedetransitions:

./� QR EK$ STEK$ STEE EK$ STEU$6SE E �VW

La modélisationd’un signal temporelpar desHMM est ainsi fondéesur deuxprincipes: (i) le signal temporelpeutêtre découpéen segmentspar unechaînedeMarkov et (ii) le signalest la réalisationd’un processusstationnairereprésentéparunedensitédeprobabilitésurl’espacedesobservationsà l’intérieur d’un segment.

Enmodélisantdela sortelessegmentscomposantle signaltemporel,on ignorelaréalitéde la productiondu signalcommerésultatd’un processusintelligentmaisonpeututiliser desalgorithmesd’apprentissageet dereconnaissancerapides[BOY 90].Cettefaçondeprocéderestcomplémentaired’uneapprocheanalytiqueet explicativefondéesurunmécanismederaisonnement.Enmesurantprécisémentparuneprobabi-lité cequel’on qualifieaupremieraborddehasardeux,on diminuel’indéterminismedenotreperceptionduprocessuset onpeutfaireapparaîtredescomportementsexpli-cablesdoncprévisiblesqui pourrontêtreréutilisésdansun mécanismede raisonne-ment; cemécanismed’extractionet deréutilisationestun desprincipesde la fouillededonnées.

1.3. Probabilitéd’un alignementtemporel

En adoptantlesnotationsdéfiniesparRabinerdans [RAB 95], on appelleX unefonctiond’un intervalledetempsfini Y � �[Z]\ dansl’ensemble� desétats.X_^�Y � �[Z`\bac�

Page 7: Segmentation temporelle et spatiale de données agricoles

256 Actesdes6��������

JournéesCASSINI 2002

Ondéfinitunalignementtemporelentreunesuited’étatsXd��e � �Ke ! �f$%$&$%�Ke%g��h$%$%$Ue&iatteintsrespectivementauxtemps

� � � �f$&$%$&� �j$%$&$UZ etunesuitedeobservations���k ��� k !l�f$%$&$%� k g �j$&$%$ k i parunecorrespondance(état,observation).Saprobabilitéestdéfiniepar:

mPn k A#02Xo� �p7I�rq g 1ts�uwvGx�s�uwvzyHs�u�A{s�u%0 k g 7 (1)

où :

– 1 s uwvGx s uwvzy s u représentela probabilitéde la contribution de la chaînede Markoventrelesinstants

� �et

(casd’unechaîned’ordre2) qui définit la segmentation;

– A s u&0 k g[7 représentela vraisemblancedel’observation k g conditionnéeà la densitédel’état e{g .

Dansle casdesmodèlesde Markov gauche-droitedécritsdansla figure 1, unalignemententreétatset observationsdéfinit unesegmentation.

La vraisemblance|M0@�p7 estcalculéeenconsidéranttouslesalignementspossible.

|M02�p7I� 8[} mPn k A�02Xo� �p7 (2)

La représentationd’un phénomènetemporelou spatialà l’aide d’un HMM peutavoir plusieursobjectifs:

– estimation ou apprentissagede paramètres.Par exempleon veut calculerles pro-babilitésdessuccessionsde culturesà la lumièredesobservationsfaitesdansunerégion.

– discrimination oureconnaissance.Parexemple,unefois le modèleestimé,onveutretrouver la suited’étatsla plusprobablequi expliqueunesuited’observations.

– segmentation parexemple,on rechercheunedatedechangemententredeuxétatsdonnés.

Un grandintérêtdesHMM estqu’ils possèdentdesalgorithmespolynomiauxdanschacundecestroisdomaines.Cesalgorithmessontfondéssurla recherchedetouslesalignementsafin de retrouver celui possédantla probabilitédéfiniepar l’équation1maximale[FOR 73, BAK 74].

1.4. Estimationautomatiqued’un HMM

Unefois donnéuncorpusdedonnéesetla topologiedugraphedestransitionsentreétats,différentsalgorithmespermettentl’apprentissaged’un HMM etla déterminationdesparamètres. et A 3 0B$67 (cf.§1.2).Quelquesoit l’ordre desmodèles,nousutilisonsl’algorithmeForward- Backward[MAR 97] qui estunevariantedel’algorithmeEM[DEM 77]. L’apprentissagesefait itérativementenpartantd’un modèleoù toutesles

Page 8: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 257

transitionssontéquiprobableset où les densitésA 3 0B$67 sontfixées.L’algorithmeFor-ward- Backwardcalculeun nouveaumodèleplusadaptéauxdonnéesdanslequellavraisemblancedu corpusa augmenté.Ce nouveaumodèleestutilisé dansunenou-velle itérationjusqu’àcequela vraisemblancedu corpusatteigneun maximumlocal.Le résultatest constituépar les nouvellesvaleursdestransitions14365�= et desdensi-tés A~3�0B$67 (cf. Fig 2). Lorsque+ estle nombred’étatset Z le nombred’observations,l’algorithmeForward- Backwarda unecomplexité en +��%Z pourunHMM2.

L’estimationdesparamètresd’un HMM2 sefait grâceau calcul desprobabilitéssuivantes.

La fonction ��g{0�?l� �U7 definit la probabilitéde la séquencepartielled’observations,k � �%$N$N$�� k g etdela transition 02� 5 ��� = 7 entrelesinstants���

et

:��g{0�?l���K7�����0 k � � k ! �%$N$�$N� k g~��e{g�� � �r� 5 �He{gL��� = 7{� � � � Z]� (3)� � ?l� � � +�$��g~0�?l���U7 estcalculéepar récurrenceà partir de ��g�� � 0 < �@?47 danslequel 0@� 3 � � 5 7 et02� 5 ��� = 7 sontdeuxtransitionsentrelesétats� 3 et � = :

�hg�� � 0�?l� �U7L� '8 3���� ��g~0 < �@?47~$ 1 365�= $ A = 0 k g�� � 7~� � � � Z �� �� � ?l� � � +�$ (4)

D’une façonsimilaire, la fonction �Kg~0 < �@?47 définit la probabilitéde la séquencepartielled’observationsde

, �à Z ensupposantla transition 02� 3 � � 5 7 entrelesinstants���

et

:��g 0 < �@?47����M0 k g�� � �&$�$N$ k i�� e%g�� � �r� 3 ��e{g���� 5 7~� � � � Z �� � (5)� � < �@? � +�$Cettefonctionsecalculerécursivement:

� g 0 < ��?47L� '8 3N��� � g�� �#0�?l���K7~$ 1z395�=K$ A{=U0 k g�� �%7~� � � � Z �� � (6)� � ?l��� � +�$Unefois donnéela séquenced’observations� , nousdéfinissons�Gg 0 < �@?l���U7 comme

la probabilitéa posterioridela transition� 3 a�� 5 a�� = entrez��

et , �

pendantl’émissionde � :�#g~0 < ��?l���U7����M02e{g�� � ��� 3 �He{g��r� 5 ��e{g�� � �r� =l� �p7~� ��� � Z �� $Ondéduit:

� g 0 < ��?G� �U7L� � g 0 < ��?z7[14365�=lA{=40 k g�� �&7�� g�� �G0�?l���U7|�02�p7 � �(� � Z �� $ (7)

Page 9: Segmentation temporelle et spatiale de données agricoles

258 Actesdes6��������

JournéesCASSINI 2002

Cettequantitépermetle calculdela nouvelleestiméede 1 365�= .

1 395�= � 8 g �Gg{0 < �@?l���K7~$ (8)

Le choix du modèleinitial influe sur le résultatfinal. Pourévaluer l’adéquationdu modèleobtenuparconvergence,nousutilisonsunemesurededistanceentreétats[TOU 74]. Par essaissuccessifs,nousdéfinissonset obtenonsun modèledépendantdeplusieursfacteurs: résultatsdesexpériencesprécédentes,topologieinitiale, modedeconvergence,critèred’arrêt.

� ��� � ��� ���état1 état2 état3

prairies 0.31 prairies 0.29 blé 0.29blé 0.22 blé 0.26 prairies 0.27orge 0.16 colza 0.14 colza 0.17colza 0.12 orge 0.11 orge 0.12maïs 0.07 maïs 0.08 maïs 0.06jachères 0.05 jachères 0.05 vergers 0.02

Figure 2. Modèle1 : HMM dela figure 1 aprèsapprentissagesur lesdonnéesissuesd’unerégionagricole. Lesdistributionsdeculturesobtenuessontcaractéristiquesdela région

2. Un exemplede donnéesspatio-temporellesagricoles: lesdonnéesTer-Uti

Notre ensemblede donnéesest constituéde l’enquêteTer-Uti qui est réaliséepar un sondageà deuxniveauxde granularité.Un premiertirage,réalisépar l’IGN,consisteà sélectionnerdesphotosaériennesrégulièrementrépartiessur l’ensembledu territoiremétropolitain.Lesphotosreprésententchacuneun carréde2 km decôtéet sontséparéesen moyennepar 6 km. Un deuxièmetirage,réalisépar les DRAF1,consisteà superposersur chaquephoto,unegrille de 36 points.Comptetenude ladistanceentreles photos,la représentativité d’un point estprochede 100 hectares.L’ensemblede cessitesest visité annuellementpar desenquêteursqui relèvent lesoccupationsdessites.Pourplusde détailssur la grille Ter-Uti, on peutsereporterà[LED 92].

Nousdisposonsde résultatssur différentesrégions– Lorraine(23756points)etMidi-Pyrénées(10904points)– pourlesannées1992à2000.Outrela séquencetem-porelledesoccupationsde chaquepoint, noussavonsà quellePRA2 il appartientet�. DirectionRégionaledel’Agriculture et dela Forêt.�. PRApourPetiteRégionAgricole.

Page 10: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 259

nousconnaissonssesvoisins,c’est-à-direla dispositionrelativedechaquepointet dechaquephotoaérienne.En revanche,nousignoronsla localisationprécisedespointspourdesraisonsdesecretstatistique.

Les servicesde statistiquede la DRAF ont réparti les occupationsen différentesclasses(environ 80) qui vont de « maraissalants,étangsd’eausaumâtre» à « peu-pliers épars» en passantpar « superficieen herbeà faible productivité potentielle». Certainesde cesclassesne sont pasou peu présentesdansles régionsétudiéesconsidéréesaussiavonsnousrestreintle nombredeclassesà49,parregroupementousuppression[BEN 01].

3. ClassificationtemporelledesdonnéesTer-Uti lorraines

3.1. Étudedesrépartitionsdeculturesdansle temps

Nousnoussommestout d’abordintéressésà la définitiondepériodesd’observa-tion pendantlesquellesladistributiondesculturesnevariepas.Pourla périodeétudiée(1992-99)nousnouslimitons doncà desmodèlespossédantdeuxou trois étatsmaisautorisantdestransitionsenbouclesurlesétatscommele montrela figure1. Cemo-dèle permetde segmenterla périodeétudiéeen trois sous-périodesd’environ troisansoù le systèmeestsupposéstationnaire.On justifie a posteriori le découpageentrois étatssur8 anspar le fait quetrois anscorrespondentà l’échelledetempsd’unerotationenLorraine.

La figure2 illustre un résultatdeclassificationdanslaquellenousavonscherchétrois situationsstablesde productionagricole.Entre les années92 et 99, la régionétudiée(PRA 3063) estpasséepar trois étatsde distributionsdeculturesdifférentes.Danscesdistributions,onvoit immédiatementl’importancedesprairies(del’ordre de30 %), la progressiondu blé et du colzaaudétrimentdel’orge,et la disparitiondelajachèreaufil desans.Sur la PRA 306et d’autresrégionset à partir decesrésultats,nousavonsdéterminélesoccupationsàexaminerprioritairementdansl’ensembledesoccupationsdela baseTer-Uti ; c’est-à-direàla fois lesoccupationslesplusfréquenteset lesplusinstablesa priori : blé,orge,maïs,colzaetprairiespourla Lorraine.

3.2. Étudedesuccessionsdecultures

Dansun HMM tel quedéfini dansla figure1, il n’estpaspossibledemesurerlaprobabilitéd’unesuccessiondeculturespuisqu’uneculturen’apparaîtqu’à l’intérieurd’unerépartitionconstituantl’état. Pourpallier cedéfaut,nousintroduisonsdesétatsuniquementassociésaux culturesmajoritairesquenousvoulonsétudier(blé, maïs,orge,...). Le HMM obtenupossèdedeuxtypesd’états: lesétats“de réserve” qui sontassociésnormalementà desrépartitionsde cultures– commedansle modèle1 – et�. La PRA306estle plateaulorrainsud.

Page 11: Segmentation temporelle et spatiale de données agricoles

260 Actesdes6��������

JournéesCASSINI 2002

lesétats“de Dirac” qui sontassociésà unecultureseuleet définisparunedensitéoùla probabilitéde cetteculturevaut

�et les probabilitésde toutesles autresoccupa-

tionsvalent E . Lesétatsderéserve permettentde faireunesegmentationprogressivedesdonnées.Les culturesqui apparaissentcommeétantles plus fréquentesdansunétatderéserve,ouqui nousintéressentparticulièrement,peuventêtreplacéesdansunnouvel étatde Dirac dansuneexpériencesuivante.Finalementla figure 3 donnelatopologied’un modèle2 qui serautilisé par la suite.Cemodèlepermetd’étudierlestransitionsentrelesétatsassociésaublé,orge,maïs,colzaet prairie.Lesétatscachéssontdénotés2, 3 et 4 et jouentle rôle d’étatsderéserve.

�  U¡U¢£ ¤U¥U¦§ ¨©ª«¬­ ®®®®®®®®

®®®®

¯° ±±±±±±±±±±

±±±±±±±±

�  t¡U¢£ ¤t¥U¦² ¨©ª«¬­ ®®®®®®®®

®®®®

¯° ±±±±±±±±±±

±±±±±±±±

�  U¡U¢£ ¤U¥U¦³ª«

´@µ�¶�·¸@¹�º�»¼ ½l¾¿"À ¨©ÁÂà ÄÅÅÅÅÅÅÅÅÅÅÅÅÆÇ ®®®®®®®

®®®®´@µÈ¶�·¸@¹Èº�»¼ ½l¾¿"É ¨©ÁÂ

à ÄÅÅÅÅÅÅÅÅÅÅÅÅÆÇ ®®®®®®®

®®®®´@µ�¶�·¸@¹�º�»¼ ½l¾¿&ÊÁÂ

ËHÌÎÍÐÏÑHÒÎÓÐÔÕDÖz×ØwÙ%À ¨©ÁÂÚ ÛÅÅÅÅÅÅÅÅÅÅÅ

Ü ÝÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞ ËHÌÎÍÐÏÑHÒÎÓÐÔÕDÖz×Ø@Ù%É ¨©ÁÂÚ ÛÅÅÅÅÅÅÅÅÅÅÅ

Ü ÝÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞÞ ËHÌÎÍÐÏÑHÒÎÓÐÔÕDÖz×Ø2Ù{ÊÁÂ

ßßß ßßß ßßßFigure 3. Modèle2 : les étatsnotés2, 3 et 4 sont associésà une distribution decultures,contrairementaux étatsdénomméspar uneoccupation.Le nombre de co-lonnesdéfinit le nombre de périodesd’observation.Lesconnexionssansflèchesre-présententdestransitionsbidirectionnelles

Lesrésultatsobtenusparle modèle2 sontvisualisésaumoyend’un graphetel queprésentéen figure 4 pour la PRA 306.Les transitionsentreétatsde Dirac calculéesparl’équation7 sontreprésentéespardeslignesbriséesdèsqueleurprobabilitéatteintun certainseuil.L’épaisseurdu trait estproportionnelleà la valeurde la probabilité.L’agronomeenfait l’interprétationsuivante.

“Nous voyonssurcegraphiquedeuxensemblesdecouvertspérennesqui n’échangentau-cunesurfaceaveclesautrescouvertssurtoutela période: lesprairiespermanentesproductives(notéesppp), les bois; de plus apparaissentdeuxpetitsgroupesde monocultures: la mono-culturedeblé qui restestablesur la période,et la monoculturede maïsqui diminueenfin depériode.

L’orgesemblechangerdestatutdansles successionsculturales: d’un rôle de “tampon” àcelui d’élémentstabled’unerotation:

Page 12: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 261

Figure4. Résultatsdu modèle2 sur lesdonnéesdela PRAPlateaulorrain sud(PRA306)entre1992et1999.La lignedénotée“ ?” correspondà unétatderéserveaffichéet celledénotéepar pppcorrespondauxprairiespermanentesproductives

– audébut de la période,l’orgeprécèdeun colzaou un maïsou mêmeun blé et existeencoupleorge-orge,

– à la fin dela période,selit uneforte régularitéblé-orge-colza,où l’orgen’estplussuiviequedecolza.L’orgepermeteneffet unepréparationprécocedu sol pourle colzacarsarécolteesttôt ensaison.

A contrario, le bléresteàuneplacesemblabledansla succession: il estprécédentàmaïs,colza,orge. . .ouà lui-même”.

3.3. Étudedesévolutionsdesuccessions

Nousavonsensuitetentédedéterminerlessuccessionsmajoritairesenfixant leurtaille à 3. Cettevaleurn’est pasarbitrairemaiscorrespondà uneobservation sur laLorraine: dansla presquetotalitédescas,lessuccessionss’organisentenrotationavecdestêtesderotationqui reviennentauplustouslestroisans.Touslestripletspossiblesde la basesontconsidérés(6 triplets pour 8 années,donc81915pour 23756points,maisseulement1109tripletsdifférents).Chaquetriplet constitueuneobservationdetrois occupationssuccessives faitespendantla période1992-99.Les résultatsde laclassificationont étéétudiéssousformedesimplestableauxetont permisde:

– repérerles successionsdansles triplets, c’est-à-direregrouperles différentespermutations: onvérifieainsiquelestriplets(colzabléorge),(bléorgecolza)et(orge

Page 13: Segmentation temporelle et spatiale de données agricoles

262 Actesdes6��������

JournéesCASSINI 2002

colzablé)ontàpeuprèsla mêmereprésentationdanschacundesétats; demêmepour(blé colzablé) et (colzablécolza);

– repéreret évaluerlessuccessionsmajoritaires: on vérifie quedeuxsuccessions(colzabléorge)et (colzablé) représententunegrossepartiedesterrescultivées(envi-ron28 %);

– étudierla progression,l’apparitionou la disparitiondesdifférentessuccessionsdansla périodeconsidérée.

À l’issue de cetteanalyse,nousavonsdéfini les successionsà étudierdavantagesousformedegrandesclassesouderotationstypes(colza+2céréales,colza+1céréale,maïs+2céréales,maïs+1céréale,monocultures).Nousavonsalors,commelors de lapremièreétape,construitun nouveaumodèle– appelémodèle3 – danslequeldesétatsn’émettentquecestripletset leurspermutationscirculaires(cf. figure5).

à�á%�Uá&âHãtä�å@ã4æ"ç�è#ç�âêéç~æ�éç~ëGäìç%í��îîîîîîîîîîîîîîîî

îî

ïïïïïïïïïïïïïïïïïï

ïïïïïïïïïï ð æ%ë#ñ�æ&ñwç%í�ò ð ç~æ%àôóõö

÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷

÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷ ÷÷

� âHá"äìø&ë]ù � âbéç~æ�éç{ëGäìç%íõö úúúúúúúúúúúúúúúúúúîîîîîîîîîîîîîîîî

îî � â�á&äìø"ëlí�ù � âbéç%æ�éç ëGäìç��î î î î î î î î î î î î î î î î î î

ú ú ú ú ú ú ú ú ú ú ú ú ú ú ú ú úúàÈë#ûü�í�ù � âbéç{æ�éç~ëGäìç%íõö à�á%�Uá&âHãtä�å�ãzæ"ç�è#ç�àÈë#ûüwí��î î î î î î î î î î î î î î î î î î

ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ï ïFigure 5. Modèle3 : modèledetriplets,similaire au modèle2. Un étatparticulariseunerotationtype. Touteslestransitionssontbidirectionnelles

Les résultatsde ce modèlepeuvent êtreprésentésde la mêmefaçonquesur lafigure 4. Commeune observation est un triplet correspondantà trois observationsTer-Uti aux annéesý , ý�, �

et ý�, �du mêmepoint, on l’indice par sonannéede

début. Ainsi le derniertriplet (1997-1998-1999) estnoté1997.Les transitionsentrerotationssontindiquéespar les lignesobliques,lesvariationsde l’importanced’unemêmerotationsontreprésentéespar l’épaisseurdu trait horizontal,dèsquela proba-bilité a posterioridépasse1,0%. Cettevaleurcorrespondàunseuild’affichageajustéparl’utilisateur. Eneffet, l’affichagedesrésultatspeutêtremodifiéparl’utilisateur, etdoncêtreplusou moinslisible, et faireapparaîtreplusou moinsd’informations.

Lestrajectoiresentreétatsmisesenévidencedansla figure4 deviennentdeslignesdroitesdanslesfigures 6 et 7. Cesdeuxfiguresreprésententlesrésultatsobtenussurla mêmerégion(PRA306),avecdeuxseuilsdifférents: surla figure6 ceseuilestfixéà 1 % età 0,4% surla figure7.

Ainsi, l’agronomeva utiliser différemmentles deuxfigures6 et 7. Il a beaucoupdemaldetravailler auseuilde0,4%. Enrevanche,avecle seuillageà1,0%, il trouvedestendancestrèsinstructives:

Page 14: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 263

Figure 6. Résultatsobtenusà partir du modèle3 sur lesdonnéesde la PRAPlateaulorrain sudentre1992et 1999

Figure7. Résultatsdu modèle3 sur lesdonnéesdela PRAPlateaulorrain sudentre1992et1999

Page 15: Segmentation temporelle et spatiale de données agricoles

264 Actesdes6��������

JournéesCASSINI 2002

– “la classedesmonoculturesdeprairiesdominelargementtouteslesautreset restestable(aucuneévolution detyperetournementdeprairiesou remiseenherbedeculturen’apparaît);

– l’état de réserve diminuepour alimenterles successionscolza+ 2 céréaleset maïs+ 2céréales;

– lestransitionssontnombreusesentrecolza+ céréaleet colza+ 2 céréales,cequi signifiequesurunemêmeparcellecesdeuxsuccessionspeuventavoir lieu (deplusenplusvrai plusonarrive enfin depériode);

– lesmonoculturesdecéréalessontpeunombreuses,instablesdansle temps,etnonreliéesà d’autressuccessions;

– la successionmaïs+ 2 céréalesest trèsstableet augmentelégèrementen fréquenceaucoursdela période.

En conclusion,cetterégionresteà dominancede monocultureprairiale,avec unetendanceàaccroîtrelessuccessions(colzaou maïs)+ 2 céréalesdanslesparcellescultivées.”

UneétudecomplèteaétémenéesurlesPRA lorrainesentrelesannées92– 2000.Desrésultatscomplémentairessontdonnésdans[BEN 01].

4. Classificationspatiale

Dansun espacede dimensiondeux,commeune image,la notion de chaînedeMarkov segénéraliseen donnantnaissanceà la notion de champde Markov : l’étatd’un point – appeléaussiun site– dépendseulementdesesplusprochesvoisinsspa-tiaux.Lesalgorithmesd’estimationet declassementdeviennentalorspluscomplexesà mettreen œuvre.Au contraire,en suivant l’exemplede [BEN 95], nousavonsin-troduit unerelationd’ordresur lespointsdu planqui respecteautantquepossiblelanotiondevoisinage: on passealorsd’un problèmedesegmentationsurdeuxdimen-sionsàunproblèmedesegmentationsuruneseuledimension,commeprécédemment.Les HMM permettentainsi d’effectuerunesegmentationen régionsgéographiqueshomogènesdu point devuedesdensitésassociéesauxétats.Pourordonnerlessites,nousutilisonsunecourbede Peanoqui estunecourbefractaleet qui parcourttouslespointsdu planenrespectantla notiondevoisinagespatial(cf. Fig. 8). La priseencomptedu voisinagespatialdanscetteapprochen’estpascomplète.Alors quedeuxpointsvoisinssur la courbesontvoisinsdansle plan, la réciproquen’est pasvraie.Dansles faits, commele montrentdestravaux récents[BEN 95], cetteconcessionà la topologien’affectepasles résultatsen segmentationd’imageset en analysedetextures.La figure9 montreunephotoaérienneen 256 niveauxde gris ainsi que laclassificationobtenueà l’aide d’un HMM ergodique4 de5 états.La cartouchesituéeenhautet à droitedela photo9(b) montreenfonctiondu niveaudegris quelleestlatransitionde probabilitémaximale.On ne montrepasles transitionsentreétatsdif-férents.On voit quelesrégionsde texturehomogènessontassociéesaubouclageduprocessusstochastiquesurchacundes5 états.Dansunerégionuniforme,lesniveauxde gris despixels suivent la distribution associéeà un état.Le choix du modèleini-þ. Touslesétatssontinter-connectés.La matriceÿ necontientpasdezéro.

Page 16: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 265

tial qui conditionnele nombrede classesextraitesest toujoursun problèmeouvert[BRE 01, PRE98].

(a) image2x2 (b) image4x4 (c) image6x6

Figure8. Ordonnancementdespointsdu plansuivantunecourbefractale

(a)originalen256couleurs (b) segmentationparunHMM ergodiqueà5 états

Figure9. Segmentationen5 étatsd’unephotoaérienne

4.1. ClassificationdesdonnéesTer-Uti

Nousavonsadaptéla courbede Peanopour pour parcourirl’ensembledessitesTer-Uti enrespectantlesdeuxniveauxderésolutionspatialepropresauxdonnéesTer-Uti : un premierparcourspermetd’introduire unerelation d’ordre sur les

�z��� �l�photosaériennescouvrantla Lorraineou la régionMidi-Pyrénées5 ; undeuxièmepar-

�. Nousavonsajoutédesphotos“noires” pourobtenirun espacecarré,nécessaireauparcours

dePeano.

Page 17: Segmentation temporelle et spatiale de données agricoles

266 Actesdes6��������

JournéesCASSINI 2002

coursà l’intérieur desphotosaériennesordonnelessitesTer-Uti (cf. parcoursdonnéFig. 8(c)). Nouspouvonsainsi réaliserunesegmentationspatialedesdonnées: unpoint n’est plus classéen fonction de sesprécédentstemporels,maisen fonctiondesesprécédentsspatiauxselonla courbedePeano.

(a)ClassificationobtenueparunHMM2 (b) CorineLandCover

Figure 10. Classificationobtenuepar un HMM2 à 10 étatsaprès10 itérations etcomparaisonavecla cartedela Lorraineétabliedansle cadreduprogrammeCorineLandCover à partir dedonnéessatellitaires(IFEN, 1993)

Avec un changementminime dansle programmed’apprentissage,nous avonstraité l’ensembledesdonnées,chaqueannéeindividuellementet toutesles annéesensemble.Nousavonstraité lesdonnéesbrutes(un site= uneculture)et lesdonnéesdessuccessions(un site = unesuccessionde culturessur trois années).Ce sontcesdernièresqui ont fourni lesrésultatslesplusstables.Ceprocessusdeclassificationestnonsupervisé; l’utilisateur définit seulementle nombreinitial d’étatscorrespondantaunombremaximumderégionsàdécouvrir. Nousobtenonsdescartes(cf. Fig. 10(a)pour la Lorraineet Fig. 11 pourMidi-Pyrénés)où sedistinguentplusieurszonesho-mogènesvis-à-visdel’occupationdusol.Pourla Lorraine,nousdistinguonscinqétatsprincipaux,lesautresétatsprovenantd’unedivisionabusiveparl’algorithme:

– unétatàmajoritédebâti (30%), forêt,solsnus,zoneshumides,qui suit le coursdesgrandesvallées;

– un étatà majoritédeforêt (98 %) qui englobele massifvosgienet lesforêtsdela Meuse;

– un étatà majoritédeprairies(30 %), forêt (20 %) et culturesfourragères(6 %)caractéristiquedesrégionsd’élevage;

Page 18: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 267

– un étatà majoritéde cultures(30 % pour blé, colza,et orge) et prairie (10 %)définissantlesrégionsà dominantecéréalière;

– un étatà majoritéde prairies(68 %) et présvergers(5 %) au fond desvalléesvosgienneset enpiedsdecôtes.

On retrouve globalementsur la figure 10(a) la localisationdesoccupationsaffi-chéessur la cartede la figure 10(b) tellesqu’ellessontétabliesà partir de donnéessatellitairesà uneéchelle4 fois6 plusfine (programmeCorin LandCover). La loca-lisation desétatsest interprétableen fonction de la géologieet descaractéristiquestechniquesdesexploitations.Ainsi en Lorraine,on retrouve les régionsgéologiquesdesVosgesgréseuses,desVosgesgranitiques,du plateaulorrain (calcaire),desval-léesde la Moselleet de la Meuse,desvalléesvosgiennes,desplainesargileuses.Ontrouve aussila distinction,sur le mêmeterraingéologique(argilesdeKeuper),entrelespetitesexploitationslaitièresduChâtenoiset lesgrandesstructuresmixtesduSaul-nois.Cettedernièredistinctionmériterad’être confortéepar uneétudesur les typesd’exploitationsagricolesenfonctiondespetitesrégionsagricoles.

4.2. Aide à l’interprétation d’imagessatellitairesenMidi-Pyrénées

Les imagessatellitairessont un moyen puissantpour connaîtreles occupationsdu sol dansune région et établir desprévisionsen matièrede productionagricoleou de besoinsen eau(cf. [CAS 98, GEN 01]). Un problèmemajeurtient pourtantau fait qu’à la dateoù les prévisionsdoivent êtreétablies(en début de saison),lesimagessatellitairesdisponiblesnesontpassuffisantespourcartographieraveccerti-tudeslesoccupationsdu sol del’annéecourante.La connaissancedessuccessionsdeculturespratiquéesdansla régionconcernéepermetalorsdelever certainesambiguï-tés: connaissantl’occupationd’une parcellel’annéeprécédente,on réduit le champdespossiblespour l’annéecouranteet uneimagede début de saison,qui permetdedistingueruniquementlesculturesdeprintempset culturesd’hiver, peutalorssuffirepourconclure.Cetteapprochea étéétudiéedans[LAR 00] avecun modèlequalitatifdessuccessionsdecultures.

Nous intervenonsdansun projet qui a pour but de testercetteapprochedanslecadrede la gestionde l’irrigation enMidi-Pyrénées.Il s’agit dansun premiertempsderassemblerunecarted’occupationdu sol à l’année ý ��

et uneimagesatellitairededébut desaison(avril) del’annéeý . Dansundeuxièmetemps,il s’agitd’établir lesprobabilitésde transitionentreculturesà partir de donnéesTer-Uti sur la région.Leprincipeestalorsde couplerles imageset lesprobabilitésde transitionpourobteniruneestimationdelacarted’occupationdusolàl’annéeý . L’évaluationdel’estimationobtenues’appuiesurunecarted’occupationdu sol de l’année ý établiea posteriori.Pour ce projet, les cartesd’occupationdu sol peuvent être obtenuesde différentesfaçons,par relevé de terrainou par croisementde trois imagessatellitairesprisesàdifférentespériodes.

�. Un pointTer-Uti représente100ha,contre25 hadansle programmeCorin LandCover.

Page 19: Segmentation temporelle et spatiale de données agricoles

268 Actesdes6��������

JournéesCASSINI 2002

En collaborationavec le centreINRA deToulouse,nousavonsdonceffectuéuneclassificationautomatiquenon superviséede la régionMidi-Pyrénéespour dégagertrois régionshomogènescaractériséeschacunepar leur successions.Nousavonsap-pliquélesmêmestraitementsquepourla Lorrainetelsqu’ils sontdéfinisdansla sec-tion 4. Sur chaquerégion,nousavons ensuiteprocédéà uneanalyseplus fine afind’étudierlesévolutionstemporelledessuccessionsselonla démarchedécriteensec-tion 3. Le but estdeconstruirele modèle2 et sondiagramme(cf. Fig. 4) surchaquerégionafind’avoir lesvaleursdesprobabilitésdetransitionentreculturessuivantl’en-droit et l’année.

Surla figure11,du NordauSud,on distingue3 régionshomogènes:

années900.099 bois+ bois+ bois0.089 maïs+ maïs+ maïs0.082 prairies+ prairies+ prairies0.034 blé+ tournesol+ blé0.028 vignes+ vignes+ vignes0.026 tournesol+ blé+ tournesol0.018 jachères+ jachères+ jachères

années20000.105 maïs+ maïs+ maïs0.099 bois+ bois+ bois0.081 prairies+ prairies+ prairies0.056 blé+ tournesol+ blé0.037 tournesol+ blé+ tournesol0.027 vignes+ vignes+ vignes0.023 jachères+ jachères+ jachères

Figure11. CartographiedessuccessionsculturalesdanslesdépartementsduGersetdesHautes-Pyrénées

– auNord,unepremièrezonecoloréeengris clair contientlescultures.Unemo-délisationdecetterégionparunmodèledeMarkov àtroisétatsdétectetroispériodes.On remarquedansles2 tableauxdedroite la progressiondela rotationblé-tournesolet dela monoculturedu maïsdurantles10 dernièresannées;

– plusauSud,unedeuxièmezonecoloréeengris foncédanslaquellela distribu-tion descouvertsrestestationnaireet estconstituéedebois,desuperficieenherbeetdespremiersalpages;

– enfin,unedernièrezonecoloréeennoir contientlesmassifsmontagneux.

On voit surcetexemplel’intérêt d’utiliser le mêmemodèledesegmentationdanslesdimensionsspatialeset temporellesdesdonnées.La segmentationspatialepermetde définir desrégionshomogènesvis-à-visdessuccessionssur une longuepériodepuisunesegmentationtemporellepermetuneétudeplusfine régionparrégion.

Page 20: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 269

5. Discussionset conclusions

Nousavonsdéveloppéuneméthodede classificationde donnéestemporellesetspatialesqui est fondéesur le calcul d’une probabilitéa posteriori obtenueà partird’un modèleprobabiliste– le HMM – qui prendencomptela variabilitétemporelleetspatialedesdonnées.La mêmemesureprobabilistesertà classerlesdonnéesdansletempset dansl’espaceet donneunecohérenceauxtraitements.

Pourlesagriculteurs,le choix dessuccessionsculturalesestle révélateura poste-riori desajustementsqu’il réalisententreleursparcellesdisponibleset l’importancesurfaciquedescouvertsvégétauxqu’ils ont choisis.Une lecturede cessuccessionsnousrenseignesur lesdifficultéset lessimplificationsauxquellessontconfrontéslesagriculteursdansleurajustement“territoire – couvertsvégétaux”.

D’autrepart,lessuccessionsculturalessontdesrésultatsd’organisationd’agricul-teursqui influencentfortementleseffetsde l’agriculturesur les ressourcesrenouve-lables:

– l’érosion(proportiondesinter-cultureslongues);

– la dégradationdesqualitésd’eauxsouterraines;

– lesbesoinsenirrigation;

– lesmonotoniespaysagères.

Pourl’agronome,disposerdessuccessionsculturalesà uneéchellerégionaleper-met de mieux choisir sesdispositifs.Qu’il s’agissede prévisions,d’enquêtesou demiseenplaced’expérimentations,cetoutil permetd’instruire le domainedevaliditéet d’extrapolationdesesétudes.

Enfin, il fautsoulignerquelessuccessionsculturalessontdesobjetsderecherchecentraux[SEB 88] révélateursdu métierd’agriculteur, maisqui ont donnélieu à peudepublications.

Dansle travail décrit, les allers et retoursentreagronomeset informaticienssesont traduitspar l’élaborationde plusieursmodèlespour valider les hypothèsesdesagronomes.Nousnoussommesaidésdela duréedesétatscommerévélatricedel’in-stabilitédessuccessionsainsiquedu contenudel’état deréserve qui captetouteslesexceptionset permetd’effectuerunesegmentationprogressive desdonnées.À partird’un modèlesimple– le modèle1 – donnédansles figures1 et 2, nousavonséla-borélesmodèles2 et 3 pourmesurerplusprécisémentdeschoix desuccessions.Lafigure6 montreun systèmequasimenten équilibre.Lessuccessionsdominantesontététrouvées,elle sontreprésentéespar les étatsfaiblementconnectésentreeux.Cestraitementspeuventêtreeffectuésà différenteséchelles,PRA ou régionentière,pourpeuquele nombredepointssoit suffisants.

Les algorithmesdéveloppéssur les donnéeslorrainesont pu êtreutiliséssur lesdonnéesdubassindela SeineouenMidi-Pyrénées.Lesagronomessesontappropriéset ont améliorélesoutils demodélisationet visualisationfondéssur lesHMM mis àleur disposition[CAT 99, BOR 00]. Ils ont réussià extraire desinformationsaux-

Page 21: Segmentation temporelle et spatiale de données agricoles

270 Actesdes6��������

JournéesCASSINI 2002

quellesles informaticiensn’avaientpaspenséa priori , tellesdessuccessionsà longtermedépassantl’ordre du modèle.Le diagrammede la figure 12 estextrait d’uneétudesur la qualitédel’eau danslesPRA dela régionparisienne.Il a étéannotéparet pourdesagronomes.

Figure12. Utilisation del’outil devisualisationsurunePRAdela régionparisienne

La carteissued’unesegmentation2D estun documentporteurd’uneinformationdesynthèseappréciéedesagronomesqui la comparentspontanémentàd’autrescarteset ainsi la validenten partie.Cesrésultatspermettentde remettreà jour, confirmerou infirmer les connaissancessur la régionétudiée.En découleégalementla spéci-fication d’une nouvelle classificationdanslaquellenousdevronscroiserdifférentessourcesde données: les donnéesTer-Uti, les donnéesissuesd’enquêtesauprèsdesagriculteursetrelativesauxtypesd’exploitationsagricolesmaisaussilescartesdedif-férentesdonnéespedo-morphologiqueset les photossatellitaires.Cesconnaissancespeuvententrerdansdifférentsmodèles[LeB 98, BEN 97] poureffectuerdessimula-tions prospectivessur l’occupationagricoledu sol et seseffets en matièred’eauetd’environnement.

Remerciements

NousremercionslesservicesrégionauxdesstatistiquesagricolesdesDRAF Lor-raineetMidi-Pyrénéespourl’accèsauxdonnéesTer-Uti.

Page 22: Segmentation temporelle et spatiale de données agricoles

Fouille dedonnéesagricoles 271

6. Bibliographie

[BAK 74] BAKER J. K., « StochasticModeling for Automatic SpeechUnderstanding»,REDDY D., Ed.,Speech Recognition, p. 521– 542,AcademicPress,New York, New-York,1974.

[BEN 97] BENOÎT M., PAPY F., « Pratiquesagricoleset qualitéde l’eau sur le territoireali-mentantuncaptage», L’eau dansl’espacerural, p. 323-338,INRA, 1997.

[BEN 01] BENOÎT M., LE BER F., MARI J.-F., « Recherchedessuccessionsdeculturesetdeleursévolutions : analyseparHMM desdonnéesTer-Uti enLorraine», AgresteVision -La statistiqueagricole, , n� 31,2001,p. 23–30.

[BEN 95] BENMILOUD B., PIECZYNSKI W., « EstimationdesparamètresdansleschaînesdeMarkov cachésetsegmentationd’images», Traitementdusignal, vol. 12,n� 5, 95,p. 433– 454.

[BOR 00] BORNERAND C., « Dynamiquedespratiquesculturalesdansle bassindela Marnedepuisles années70 », Mémoirede DAA ENSAIA, septembre2000, INRA SAD Mire-court.

[BOY 90] BOYER A., MARTINO J. D., DIVOUX P., HATON J.-P., MARI J.-F., SMAIL I K.,« StatisticalMethodsin Multi-Speaker AutomaticSpeechRecognition», AppliedStochas-tic ModelsandDataAnalysis, vol. 6, n� 3, 1990,p. 143–155,JohnWiley andSons,Ltd.

[BRE 01] BREHELIN L., « Modèlesde Markov cachéset apprentissagepar fusionsd’états:algorithmes,applications,utilisationspour le testdecircuits intégrés», PhDthesis,Univ.deMontpellierII, juin 2001.

[CAS 98] CASTERAD M., HERRERO J., « Irrivol : A methodto estimatethe yearly andmonthlywaterappliedin anirrigationdistrict », WaterResourcesResearch, vol. 34,1998,p. 3045–3049.

[CAT 99] CATY M., « Évolutiondespratiquesagricoleset liensavecl’évolutiondela qualitédel’eaudansle bassindela Seine», Mémoiredefin d’étudeENGEES,1999, INRA SADMirecourt.

[DEM 77] DEMPSTER A., LAIRD N., RUBIN D., « Maximum-LikelihoodFrom IncompleteDataVia TheEM Algorithm », Journal of RoyalStatisticSociety, Ser. B (methodological),vol. 39,1977,p. 1 – 38.

[FOR 73] FORNEY G., « TheViterbi Algorithm », IEEETransactions, vol. 61,1973,p. 268–278.

[GEN 01] GENOVESE G., V IGNOLLES C., NEGRE T., PASSERA G., « A methodologyfor acombineduseof normaliseddifferencevegetationindex andCORINElandcover dataforcropyield monitoringandforecasting.A casestudyonSpain», Agronomie, vol. 21,2001,p. 91–111.

[KIE 93] K IENAST F., « Analysis of historic landscapepatternswith a geographicalinfor-mation system- a methodologicaloutline », LandscapeEcology, vol. 8, n� 2, 1993,p. 103–118.

[LAR 00] LARGOUËT C., « Aide à l’interprétationd’uneséquenced’imagesparla modélisa-tion del’évolutiondusystèmeobservé.Applicationà la reconnaissancedel’occupationdusol », Thèsedel’Uni versitédeRennesI, novembre2000.

[LeB 98] LE BER F., BENOÎT M., « Modellingthespatialorganisationof landusein afarmingterritory. Exampleof a village in the PlateauLorrain. », Agronomie: Agriculture and

Page 23: Segmentation temporelle et spatiale de données agricoles

272 Actesdes6��������

JournéesCASSINI 2002

Environment, vol. 18,1998,p. 101-113.

[LED 92] LEDOUX M., THOMAS S., « De la photographieaérienneà la productiondeblé »,Agreste, la statistiqueagricole, vol. 5, 1992.

[MAR 97] MARI J.-F., HATON J.-P., KRIOUILE A., « AutomaticWord RecognitionBasedon Second-OrderHiddenMarkov Models», IEEE TransactionsonSpeech andAudioPro-cessing, vol. 5, 1997,p. 22 – 25.

[MAR 00] MARI J.-F., LE BER F., BENOÎT M., « Fouille dedonnéesparmodèlesdeMarkovcachés», Journéesfrancophonesd’ingénierie desconnaissances(IC2000), mai 2000,p. 197–205.

[PRE98] DU PREEZ J. A., « Efficient High-OrderHiddenMarkov Modelling », PhDthesis,Universityof Stellenbosh,1998.

[RAB 95] RABINER L., JUANG B., Fundamentalsof Speech Recognition, PrenticeHall, 1995.

[SEB 88] SEBILLOTTE M., « Lessystèmesdeculture», EncyclopediaUniversalis, 1988.

[TOU 74] TOU J. T., GONZALES R., PatternRecognition Principles, Addison-Wesley, 1974.