X-Git-Url: http://git.polytechnique.org/?a=blobdiff_plain;f=modules%2Ffusionax%2Fformation.pl;h=69a8923ce9b5bde23d2d123e65fdb1999d900650;hb=723d4c6b7736df20e07d2c6e32e4c37c6c80ca05;hp=19f435ac2fcfd1c3baa7492b02e56e4802600f6e;hpb=ba39c6d2636c971e5e4fe9d99eb5ed1fdc57d72d;p=platal.git diff --git a/modules/fusionax/formation.pl b/modules/fusionax/formation.pl index 19f435a..69a8923 100755 --- a/modules/fusionax/formation.pl +++ b/modules/fusionax/formation.pl @@ -12,7 +12,7 @@ while () { # Dates removal. s/\r$//; - s/(\t)*[0-9]+\t[0-9]+\t([0-9]{2}\/){2}[0-9]+$//; + s/^(FO\t\w{8}\t[^\t]*)\t[0-9]+\t[0-9]+\t([0-9]{2}\/[0-9]{2}\/[0-9]+)$/\2\t\1/; # Trailing tab, spaces and dot removal. s/(\t| )*$//; s/( \t|\t )/\t/g; @@ -20,50 +20,50 @@ while () s/ +/ /g; # Removes empty educations and jobs (they have nothing to do there). - s/^FO\t\w{8}$//; - s/^FO\t\w{8}\tProfdes Universités$//; - s/^FO\t\w{8}\tPréshonColonie Frdu Caire$//; - s/^FO\t\w{8}\tInspgénhonCEA$//; - s/^FO\t\w{8}\tProf Emérite Gén Méca$//; - s/^FO\t\w{8}\tAncDG Dassault Aviation$//; - s/^FO\t\w{8}\tPilote militaire Hélicoptère$//; - s/^FO\t\w{8}\tProfHonSupAéro$//; - s/^FO\t\w{8}\tPilote de chasse$//; - s/^FO\t\w{8}\tProf ENSMP$//; - s/^FO\t\w{8}\tProf hon Univ Bordeaux I$//; - s/^FO\t\w{8}\tProf$//; - s/^FO\t\w{8}\tIng Navigant d'Essais Hélicoptère$//; - s/^FO\t\w{8}\tMandataire agrée OEB$//; - s/^FO\t\w{8}\tIngSt$//; - s/^FO\t\w{8}\tIngretrAérospatiale$//; - s/^FO\t\w{8}\tIngénieur$//; - s/^FO\t\w{8}\tIng EURATOM$//; - s/^FO\t\w{8}\tInspGénCRdes Affd'OM$//; - s/^FO\t\w{8}\tAvocat au Barreau de Paris$//; - s/^FO\t\w{8}\tCambridge Profic$//; - s/^FO\t\w{8}\tPilotage militaire$//; - s/^FO\t\w{8}\tDirectHonBNP$//; - s/^FO\t\w{8}\tInspecteur des Finances$//; - s/^FO\t\w{8}\tMITI Japon$//; - s/^FO\t\w{8}\tEuropean Patent Attorney$//; - s/^FO\t\w{8}\tAdmciv$//; - s/^FO\t\w{8}\tDirecthon SNCF$//; - s/^FO\t\w{8}\tDDI Informatique$//; - s/^FO\t\w{8}\tDDI$//; - s/^FO\t\w{8}\tSFAF$//; - s/^FO\t\w{8}\tGestalt praticien$//; - s/^FO\t\w{8}\tAdmciv HC$//; - s/^FO\t\w{8}\tPsychologue Clinicien$//; - s/^FO\t\w{8}\tAnc Avocat au Bareau de Toulon$//; - s/^FO\t\w{8}\tAnalyste SFAF$//; - s/^FO\t\w{8}\tEcole de Chasse$//; - s/^FO\t\w{8}\tPost Doc$//; - s/^FO\t\w{8}\tSFAF CIIA$//; - s/^FO\t\w{8}\tINSEE$//; - s/^FO\t\w{8}\tEconomiste Statisticien$//; + s/^.*\tFO\t\w{8}$//; + s/^.*\tFO\t\w{8}\tProfdes Universités$//; + s/^.*\tFO\t\w{8}\tPréshonColonie Frdu Caire$//; + s/^.*\tFO\t\w{8}\tInspgénhonCEA$//; + s/^.*\tFO\t\w{8}\tProf Emérite Gén Méca$//; + s/^.*\tFO\t\w{8}\tAncDG Dassault Aviation$//; + s/^.*\tFO\t\w{8}\tPilote militaire Hélicoptère$//; + s/^.*\tFO\t\w{8}\tProfHonSupAéro$//; + s/^.*\tFO\t\w{8}\tPilote de chasse$//; + s/^.*\tFO\t\w{8}\tProf ENSMP$//; + s/^.*\tFO\t\w{8}\tProf hon Univ Bordeaux I$//; + s/^.*\tFO\t\w{8}\tProf$//; + s/^.*\tFO\t\w{8}\tIng Navigant d'Essais Hélicoptère$//; + s/^.*\tFO\t\w{8}\tMandataire agrée OEB$//; + s/^.*\tFO\t\w{8}\tIngSt$//; + s/^.*\tFO\t\w{8}\tIngretrAérospatiale$//; + s/^.*\tFO\t\w{8}\tIngénieur$//; + s/^.*\tFO\t\w{8}\tIng EURATOM$//; + s/^.*\tFO\t\w{8}\tInspGénCRdes Affd'OM$//; + s/^.*\tFO\t\w{8}\tAvocat au Barreau de Paris$//; + s/^.*\tFO\t\w{8}\tCambridge Profic$//; + s/^.*\tFO\t\w{8}\tPilotage militaire$//; + s/^.*\tFO\t\w{8}\tDirectHonBNP$//; + s/^.*\tFO\t\w{8}\tInspecteur des Finances$//; + s/^.*\tFO\t\w{8}\tMITI Japon$//; + s/^.*\tFO\t\w{8}\tEuropean Patent Attorney$//; + s/^.*\tFO\t\w{8}\tAdmciv$//; + s/^.*\tFO\t\w{8}\tDirecthon SNCF$//; + s/^.*\tFO\t\w{8}\tDDI Informatique$//; + s/^.*\tFO\t\w{8}\tDDI$//; + s/^.*\tFO\t\w{8}\tSFAF$//; + s/^.*\tFO\t\w{8}\tGestalt praticien$//; + s/^.*\tFO\t\w{8}\tAdmciv HC$//; + s/^.*\tFO\t\w{8}\tPsychologue Clinicien$//; + s/^.*\tFO\t\w{8}\tAnc Avocat au Bareau de Toulon$//; + s/^.*\tFO\t\w{8}\tAnalyste SFAF$//; + s/^.*\tFO\t\w{8}\tEcole de Chasse$//; + s/^.*\tFO\t\w{8}\tPost Doc$//; + s/^.*\tFO\t\w{8}\tSFAF CIIA$//; + s/^.*\tFO\t\w{8}\tINSEE$//; + s/^.*\tFO\t\w{8}\tEconomiste Statisticien$//; s/^\n//; # Places education in third place as if it is not reconized, it will only be stored as a description. - s/^(FO\t\w{8}\t)/\1\t\t/; + s/^(.*\tFO\t\w{8}\t)/\1\t\t/; # Fixes what can be fixed. # École d'Ingénieurs @@ -1543,87 +1543,87 @@ while () s/\t\t\tInstForm SupBiomédicale$/\t\t\tBiomédical/; # Double diploma that need to be splitted. - s/^(FO\t\w{8}\t\t)\tDoct HDR Ecotoxicologie$/\1PhD\tÉcotoxicologie\n\1HDR\tÉcotoxicologie/; - s/^(FO\t\w{8}\t\t)\tAgrégé et Doct en Génie civil$/\1PhD\tGénie civil\n\1Agr.\tGénie civil/; - s/^(FO\t\w{8}\t\t)\tDoct Habilité à la dir de rech en Philosophie$/\1PhD\tPhilosophie\n\1HDR\tPhilosophie/; - s/^(FO\t\w{8}\t\t)\tDEA\+ Thèse Doctorat Pharmacochimie moléculaire$/\1PhD\tPharmacochimie moléculaire\n\1DEA\tPharmacochimie moléculaire/; - s/^(FO\t\w{8}\t\t)\tDoctorat\, HDR Informatique$/\1PhD\tInformatique\n\1HDR\tInformatique/; - s/^(FO\t\w{8}\t\t)\tDoctorat et Habilitation$/\1PhD\t\n\1HDR\t/; - s/^(FO\t\w{8}\t)\t\tPhD et Habil à diriger les RechUniv Paris 6$/\1UPMC\tPhD\t\n\1UPMC\tHDR\t/; - s/^(FO\t\w{8}\t)\t\tMS & PhD EHESS$/\1EHESS\tPhD\t\n\1EHESS\tMSc\t/; - s/^(FO\t\w{8}\t)\t\tMBAIEP Paris Lic de Droit Assas$/\1Sciences Po\tDipl.\t\n\1Assas\tLic.\tDroit/; - s/^(FO\t\w{8}\t)\t\tIEP Paris Lic de Droit Assas$/\1Sciences Po\tDipl.\t\n\1Assas\tLic.\tDroit/; - s/^(FO\t\w{8}\t)\t\tIngENST licencié sciences économiques$/\1Télécom\tIng.\t\n\1\tLic.\tÉconomie/; - s/^(FO\t\w{8}\t\t)\tMastère Aménagement et Maitrise d'Ouvrage Urbaine$/\1M\tAménagement\n\1Maîtr.\tOuvrage Urbain/; - s/^(FO\t\w{8}\t\t)\tDEA et Thèse de Biologie$/\1PhD\tBiologie\n\1DEA\tBiologie/; - s/^(FO\t\w{8}\t)\t\tDEA Thèse Jussieu$/\1UPMC\tPhD\t\n\1UPMC\tDEA\t/; - s/^(FO\t\w{8}\t\t)\tDESS CAAE MBA$/\1DESS\t\n\1MBA\t/; - s/^(FO\t\w{8}\t)\t\tIngSupelec 86 - EMBA HEC 04$/\1Supélec\tIng.\t\n\1HEC\tMBA\t/; - s/^(FO\t\w{8}\t)\t\tMBA MscMassachus$/\1MIT\tMBA\t\n\1MIT\tMSc\t/; - s/^(FO\t\w{8}\t)\t\tMBA Columbia \+ LBS/\1Columbia University\tMBA\t\n\1London Business School\tM\t/; - s/^(FO\t\w{8}\t)\t\tMS Columbia & sciences Po/\1Columbia University\tMSc\t\n\1Sciences Po\tDipl.\t/; + s/^(.*\tFO\t\w{8}\t\t)\tDoct HDR Ecotoxicologie$/\1PhD\tÉcotoxicologie\n\1HDR\tÉcotoxicologie/; + s/^(.*\tFO\t\w{8}\t\t)\tAgrégé et Doct en Génie civil$/\1PhD\tGénie civil\n\1Agr.\tGénie civil/; + s/^(.*\tFO\t\w{8}\t\t)\tDoct Habilité à la dir de rech en Philosophie$/\1PhD\tPhilosophie\n\1HDR\tPhilosophie/; + s/^(.*\tFO\t\w{8}\t\t)\tDEA\+ Thèse Doctorat Pharmacochimie moléculaire$/\1PhD\tPharmacochimie moléculaire\n\1DEA\tPharmacochimie moléculaire/; + s/^(.*\tFO\t\w{8}\t\t)\tDoctorat\, HDR Informatique$/\1PhD\tInformatique\n\1HDR\tInformatique/; + s/^(.*\tFO\t\w{8}\t\t)\tDoctorat et Habilitation$/\1PhD\t\n\1HDR\t/; + s/^(.*\tFO\t\w{8}\t)\t\tPhD et Habil à diriger les RechUniv Paris 6$/\1UPMC\tPhD\t\n\1UPMC\tHDR\t/; + s/^(.*\tFO\t\w{8}\t)\t\tMS & PhD EHESS$/\1EHESS\tPhD\t\n\1EHESS\tMSc\t/; + s/^(.*\tFO\t\w{8}\t)\t\tMBAIEP Paris Lic de Droit Assas$/\1Sciences Po\tDipl.\t\n\1Assas\tLic.\tDroit/; + s/^(.*\tFO\t\w{8}\t)\t\tIEP Paris Lic de Droit Assas$/\1Sciences Po\tDipl.\t\n\1Assas\tLic.\tDroit/; + s/^(.*\tFO\t\w{8}\t)\t\tIngENST licencié sciences économiques$/\1Télécom\tIng.\t\n\1\tLic.\tÉconomie/; + s/^(.*\tFO\t\w{8}\t\t)\tMastère Aménagement et Maitrise d'Ouvrage Urbaine$/\1M\tAménagement\n\1Maîtr.\tOuvrage Urbain/; + s/^(.*\tFO\t\w{8}\t\t)\tDEA et Thèse de Biologie$/\1PhD\tBiologie\n\1DEA\tBiologie/; + s/^(.*\tFO\t\w{8}\t)\t\tDEA Thèse Jussieu$/\1UPMC\tPhD\t\n\1UPMC\tDEA\t/; + s/^(.*\tFO\t\w{8}\t\t)\tDESS CAAE MBA$/\1DESS\t\n\1MBA\t/; + s/^(.*\tFO\t\w{8}\t)\t\tIngSupelec 86 - EMBA HEC 04$/\1Supélec\tIng.\t\n\1HEC\tMBA\t/; + s/^(.*\tFO\t\w{8}\t)\t\tMBA MscMassachus$/\1MIT\tMBA\t\n\1MIT\tMSc\t/; + s/^(.*\tFO\t\w{8}\t)\t\tMBA Columbia \+ LBS/\1Columbia University\tMBA\t\n\1London Business School\tM\t/; + s/^(.*\tFO\t\w{8}\t)\t\tMS Columbia & sciences Po/\1Columbia University\tMSc\t\n\1Sciences Po\tDipl.\t/; ############################################################################# # Devel formatting. # # Both university and diploma missing. - #s/^FO\t\w{8}\t\t\tExpertise comptable$//; - #s/^FO\t\w{8}\t\t\tLangues orientales \(Chinois\)$//; - #s/^FO\t\w{8}\t\t\tÉducateur spécialisé$//; - #s/^FO\t\w{8}\t\t\tGestion$//; - #s/^FO\t\w{8}\t\t\tBiomédical$//; - #s/^FO\t\w{8}\t\t\tBrth$//; - #s/^FO\t\w{8}\t\t\tDEM$//; - #s/^FO\t\w{8}\t\t\tDT$//; - #s/^FO\t\w{8}\t\t\tBESG$//; - #s/^FO\t\w{8}\t\t\tESO$//; - #s/^FO\t\w{8}\t\t\tBT$//; - #s/^FO\t\w{8}\t\t\tBEL$//; - #s/^FO\t\w{8}\t\t\tDipl Lt Et Sup Banq$//; - #s/^FO\t\w{8}\t\t\tDiplôme Nepali-Tibétain$//; - #s/^FO\t\w{8}\t\t\tReact School Harwell$//; - #s/^FO\t\w{8}\t\t\tEATG$//; - #s/^FO\t\w{8}\t\t\tDESA$//; - #s/^FO\t\w{8}\t\t\tDIUUP$//; - #s/^FO\t\w{8}\t\t\tDrrerNat$//; - #s/^FO\t\w{8}\t\t\tIAC$//; - #s/^FO\t\w{8}\t\t\tCESDR$//; - #s/^FO\t\w{8}\t\t\tAuditeur ScPolitique$//; - #s/^FO\t\w{8}\t\t\tCES Informatique$//; - #s/^FO\t\w{8}\t\t\tDon en religion$//; - #s/^FO\t\w{8}\t\t\tDSN$//; - #s/^FO\t\w{8}\t\t\tBEMS\/CHEM$//; - #s/^FO\t\w{8}\t\t\tCESSID$//; - #s/^FO\t\w{8}\t\t\tBiologie Moléculaire$//; - #s/^FO\t\w{8}\t\t\tMécanique des Transfert$//; - #s/^FO\t\w{8}\t\t\tGestion$//; - #s/^FO\t\w{8}\t\t\tDECS$//; - #s/^FO\t\w{8}\t\t\tCFAF$//; - #s/^FO\t\w{8}\t\t\tCRC$//; - #s/^FO\t\w{8}\t\t\tMASE$//; - #s/^FO\t\w{8}\t\t\tCollège des Sciences Soc et Eco$//; - #s/^FO\t\w{8}\t\t\tInstitut de Contrôle de Gestion$//; - #s/^FO\t\w{8}\t\t\tICG$//; - #s/^FO\t\w{8}\t\t\tETS II$//; - #s/^FO\t\w{8}\t\t\tFRM$//; - #s/^FO\t\w{8}\t\t\tArchitecte DPLG$//; - #s/^FO\t\w{8}\t\t\tCycle des Hautes Etudes CHEE$//; - #s/^FO\t\w{8}\t\t\tCHEE&DD Session 9$//; - #s/^FO\t\w{8}\t\t\tCSME Session 29$//; - #s/^FO\t\w{8}\t\t\tInternat Teachers Progr$//; - #s/^FO\t\w{8}\t\t\tCSCP$//; - #s/^FO\t\w{8}\t\t\tBaccalauréat canonique$//; - #s/^FO\t\w{8}\t\t\tCertif européen de Psychothérapie$//; - #s/^FO\t\w{8}\t\t\tIFG$//; - #s/^FO\t\w{8}\t\t\tIFP$//; - #s/^FO\t\w{8}\t\t\tArchitecte dplg$//; - #s/^FO\t\w{8}\t\t\tLLCE Chinois INALCO$//; - #s/^FO\t\w{8}\t\t\tInst du Contrôle de Gestion$//; - #s/^FO\t\w{8}\t\t\tInstitut Auguste Comte$//; - #s/^FO\t\w{8}\t\t\tInst Auguste Comte$//; - #s/^FO\t\w{8}\t\t\tUSMC Command & Staff College$//; - #s/^FO\t\w{8}\t\t\tISNSE Argunne National Laboratory USA$//; + #s/^.*\tFO\t\w{8}\t\t\tExpertise comptable$//; + #s/^.*\tFO\t\w{8}\t\t\tLangues orientales \(Chinois\)$//; + #s/^.*\tFO\t\w{8}\t\t\tÉducateur spécialisé$//; + #s/^.*\tFO\t\w{8}\t\t\tGestion$//; + #s/^.*\tFO\t\w{8}\t\t\tBiomédical$//; + #s/^.*\tFO\t\w{8}\t\t\tBrth$//; + #s/^.*\tFO\t\w{8}\t\t\tDEM$//; + #s/^.*\tFO\t\w{8}\t\t\tDT$//; + #s/^.*\tFO\t\w{8}\t\t\tBESG$//; + #s/^.*\tFO\t\w{8}\t\t\tESO$//; + #s/^.*\tFO\t\w{8}\t\t\tBT$//; + #s/^.*\tFO\t\w{8}\t\t\tBEL$//; + #s/^.*\tFO\t\w{8}\t\t\tDipl Lt Et Sup Banq$//; + #s/^.*\tFO\t\w{8}\t\t\tDiplôme Nepali-Tibétain$//; + #s/^.*\tFO\t\w{8}\t\t\tReact School Harwell$//; + #s/^.*\tFO\t\w{8}\t\t\tEATG$//; + #s/^.*\tFO\t\w{8}\t\t\tDESA$//; + #s/^.*\tFO\t\w{8}\t\t\tDIUUP$//; + #s/^.*\tFO\t\w{8}\t\t\tDrrerNat$//; + #s/^.*\tFO\t\w{8}\t\t\tIAC$//; + #s/^.*\tFO\t\w{8}\t\t\tCESDR$//; + #s/^.*\tFO\t\w{8}\t\t\tAuditeur ScPolitique$//; + #s/^.*\tFO\t\w{8}\t\t\tCES Informatique$//; + #s/^.*\tFO\t\w{8}\t\t\tDon en religion$//; + #s/^.*\tFO\t\w{8}\t\t\tDSN$//; + #s/^.*\tFO\t\w{8}\t\t\tBEMS\/CHEM$//; + #s/^.*\tFO\t\w{8}\t\t\tCESSID$//; + #s/^.*\tFO\t\w{8}\t\t\tBiologie Moléculaire$//; + #s/^.*\tFO\t\w{8}\t\t\tMécanique des Transfert$//; + #s/^.*\tFO\t\w{8}\t\t\tGestion$//; + #s/^.*\tFO\t\w{8}\t\t\tDECS$//; + #s/^.*\tFO\t\w{8}\t\t\tCFAF$//; + #s/^.*\tFO\t\w{8}\t\t\tCRC$//; + #s/^.*\tFO\t\w{8}\t\t\tMASE$//; + #s/^.*\tFO\t\w{8}\t\t\tCollège des Sciences Soc et Eco$//; + #s/^.*\tFO\t\w{8}\t\t\tInstitut de Contrôle de Gestion$//; + #s/^.*\tFO\t\w{8}\t\t\tICG$//; + #s/^.*\tFO\t\w{8}\t\t\tETS II$//; + #s/^.*\tFO\t\w{8}\t\t\tFRM$//; + #s/^.*\tFO\t\w{8}\t\t\tArchitecte DPLG$//; + #s/^.*\tFO\t\w{8}\t\t\tCycle des Hautes Etudes CHEE$//; + #s/^.*\tFO\t\w{8}\t\t\tCHEE&DD Session 9$//; + #s/^.*\tFO\t\w{8}\t\t\tCSME Session 29$//; + #s/^.*\tFO\t\w{8}\t\t\tInternat Teachers Progr$//; + #s/^.*\tFO\t\w{8}\t\t\tCSCP$//; + #s/^.*\tFO\t\w{8}\t\t\tBaccalauréat canonique$//; + #s/^.*\tFO\t\w{8}\t\t\tCertif européen de Psychothérapie$//; + #s/^.*\tFO\t\w{8}\t\t\tIFG$//; + #s/^.*\tFO\t\w{8}\t\t\tIFP$//; + #s/^.*\tFO\t\w{8}\t\t\tArchitecte dplg$//; + #s/^.*\tFO\t\w{8}\t\t\tLLCE Chinois INALCO$//; + #s/^.*\tFO\t\w{8}\t\t\tInst du Contrôle de Gestion$//; + #s/^.*\tFO\t\w{8}\t\t\tInstitut Auguste Comte$//; + #s/^.*\tFO\t\w{8}\t\t\tInst Auguste Comte$//; + #s/^.*\tFO\t\w{8}\t\t\tUSMC Command & Staff College$//; + #s/^.*\tFO\t\w{8}\t\t\tISNSE Argunne National Laboratory USA$//; ## # Formatted stuff. - #s/^FO\t\w{8}((\t|\t\t)[a-zA-Z1-9'\.éèêùüàäïîşńÉÈÊÙÀÜÄÏÎŞŃ \-\(\)]+)\t.*//; + #s/^.*\tFO\t\w{8}((\t|\t\t)[a-zA-Z1-9'\.éèêùüàäïîşńÉÈÊÙÀÜÄÏÎŞŃ \-\(\)]+)\t.*//; # # Removes empty lines. s/^\n//;