/[formed]/trunk/tools/anonym/xmlimport.py
ViewVC logotype

Contents of /trunk/tools/anonym/xmlimport.py

Parent Directory Parent Directory | Revision Log Revision Log


Revision 280 - (show annotations)
Wed Jul 23 10:45:59 2008 UTC (16 years, 7 months ago) by teichmann
File MIME type: text/x-python
File size: 29362 byte(s)
Fixed issue472


1 #!/usr/bin/python
2 # -*- coding: utf-8 -*-
3 # (c) 2008 by Intevation GmbH
4 # author: Sascha L. Teichmann
5 #
6 import sys
7 from datetime import date
8
9 import getopt
10
11 from xml.sax.saxutils import DefaultHandler
12 from xml.sax import parse
13
14 import psycopg2 as dbapi
15
16 def _int_converter(s):
17 return int(s)
18
19 def _bool_converter(s):
20 return int(s)
21
22 def _date_converter(s):
23 return date(*[int(x) for x in s.split("-")])
24
25 def _choice_converter(s):
26 return int(s)
27
28 def _radio_converter(s):
29 return int(s)
30
31 def _text_converter(s):
32 return s
33
34 RELATIONS = {
35 'master': {
36 "einverstaendniserklaerung": _bool_converter,
37 "fkz": _text_converter,
38 "name_kompetenzagentur": _text_converter,
39 "vorname": _text_converter,
40 "name": _text_converter,
41 "erstgespraech": _date_converter,
42 "zugang_kompetenzagentur": _choice_converter,
43 "kundennummer": _text_converter,
44 "schulpflichtig": _bool_converter,
45 "noch_schueler": _bool_converter,
46 "bei_eintritt_ist_der_jugendliche": _choice_converter,
47 "rechtlicher_kontext": _choice_converter,
48 "schnittstelle_zu": _choice_converter,
49 "kontaktdaten_arge": _text_converter,
50 "kundennummer_arge": _text_converter,
51 "kontaktdaten_agentur_fuer_arbeit": _text_converter,
52 "kundennummer_agentur_fuer_arbeit": _text_converter,
53 "kundennummer_jugendamt": _text_converter,
54 "kontaktdaten_jugendamt": _text_converter,
55 "kontaktdaten_schule": _text_converter,
56 "schulname": _text_converter,
57 "kontaktdaten_gerichtshilfe": _text_converter,
58 "kundennummer_gerichtshilfe": _text_converter,
59 "kontaktdaten_weitere_institutionen": _text_converter,
60 "vorname_1": _text_converter,
61 "name_1": _text_converter,
62 "geschlecht": _choice_converter,
63 "geburtsdatum": _date_converter,
64 "familienstand": _choice_converter,
65 "strasse": _text_converter,
66 "plz": _text_converter,
67 "wohnort": _text_converter,
68 "groesse_wohnort": _choice_converter,
69 "vorwahl": _text_converter,
70 "telefon_1": _text_converter,
71 "mobiltelefon": _text_converter,
72 "email": _text_converter,
73 "telefon_sonstige": _text_converter,
74 "zweiter_wohnort": _text_converter,
75 "geburtsland": _choice_converter,
76 "geburtsland_sonstige_nennung": _text_converter,
77 "muttersprache": _choice_converter,
78 "muttersprache_sonstige_nennung": _text_converter,
79 "staatsangehoerigkeit": _choice_converter,
80 "staatsangehoerigkeit_sonstige_nennung": _text_converter,
81 "aufenthaltsstatus": _choice_converter,
82 "aufenthaltsdauer": _int_converter,
83 "vater": _choice_converter,
84 "mutter": _choice_converter,
85 "familiaere_situation_1": _choice_converter,
86 "vorname_2": _text_converter,
87 "name_2": _text_converter,
88 "vorwahl_1": _text_converter,
89 "telefon_1_1": _text_converter,
90 "mobiltelefon_1": _text_converter,
91 "email_1": _text_converter,
92 "geschwister": _int_converter,
93 "anzahl_kinder": _int_converter,
94 "haushalt_jugendlicher": _int_converter,
95 "alleinerziehend": _choice_converter,
96 "familie_selbststaendig": _bool_converter,
97 "familie_staatliche_unterstuetzung": _bool_converter,
98 "jugendlicher_selbststaendig": _bool_converter,
99 "jugendlicher_staatliche_unterstuetzung": _bool_converter,
100 "jugendlicher_unterstuetzung_soziales_umfeld": _bool_converter,
101 "wohnaufenthalt": _choice_converter,
102 "arzt_gutachten_physisch": _bool_converter,
103 "physische_beeintraechtigungen": _choice_converter,
104 "physische_beeintraechtigungen_text": _text_converter,
105 "arzt_gutachten_psychisch": _bool_converter,
106 "psychische_beeintraechtigungen": _choice_converter,
107 "psychische_beeintraechtigungen_text": _text_converter,
108 "anerkannte_behinderung": _choice_converter,
109 "mutter_2": _bool_converter,
110 "vater_2": _bool_converter,
111 "grosseltern": _bool_converter,
112 "geschwister_2": _bool_converter,
113 "pflegefamilie_1": _bool_converter,
114 "stiefmutter": _bool_converter,
115 "stiefvater": _bool_converter,
116 "verwandte_1": _bool_converter,
117 "partner": _bool_converter,
118 "heimbetreuerin": _bool_converter,
119 "betreuerin": _bool_converter,
120 "lehrerin": _bool_converter,
121 "mitbewohner": _bool_converter,
122 "partner_mutter": _bool_converter,
123 "partner_vater": _bool_converter,
124 "freund": _bool_converter,
125 "keine_bezugsperson": _bool_converter,
126 "hobbies_1": _choice_converter,
127 "hobbies_text": _text_converter,
128 "mitarbeit_organisationen": _choice_converter,
129 "organisationen_vereine_text": _text_converter,
130 "sonstiges_1": _choice_converter,
131 "sonstiges_text": _text_converter,
132 "clique": _bool_converter,
133 "freundin": _bool_converter,
134 "parterin": _bool_converter,
135 "schule_2": _choice_converter,
136 "klassenstufe": _int_converter,
137 "klassenwiederholung": _choice_converter,
138 "abgang": _int_converter,
139 "nicht_anwesende_tage": _int_converter,
140 "unentschuldigte_tage": _int_converter,
141 "schulabschluss_1": _choice_converter,
142 "schulabschlusserwerbsland": _choice_converter,
143 "schulabschlusserwerbsland_sonstige_nennung": _text_converter,
144 "abschluss_betriebliche_ausbildung": _choice_converter,
145 "abschluss_im_ausbildungsberuf": _text_converter,
146 "ausbildungsdauer": _int_converter,
147 "wann_abgeschlossen": _date_converter,
148 "weitere_ausbildungen": _int_converter,
149 "weitere_ausbildungen_text": _text_converter,
150 "dauer_weitere_ausbildungen": _int_converter,
151 "abgebrochene_ausbildungen": _int_converter,
152 "abgebrochene_ausbildungen_text": _text_converter,
153 "abschluss_ausserbetriebliche_ausbildung": _choice_converter,
154 "abschluss_im_ausbildungsberuf_1": _text_converter,
155 "ausbildungsdauer_1": _int_converter,
156 "wann_abgeschlossen_1": _date_converter,
157 "weitere_ausbildungen_1": _int_converter,
158 "weitere_ausbildungen_text_1": _text_converter,
159 "dauer_weitere_ausbildungen_1": _int_converter,
160 "abgebrochene_ausbildungen_1": _int_converter,
161 "abgebrochene_ausbildungen_text_1": _text_converter,
162 "massnahmeteilnahme": _choice_converter,
163 "letzte_massnahme": _text_converter,
164 "finanzierung": _text_converter,
165 "austrittsdatum": _date_converter,
166 "dauer": _int_converter,
167 "weitere_massnahmen": _choice_converter,
168 "massnahme_1": _text_converter,
169 "massnahme1_finanzierung": _text_converter,
170 "massnahme_2": _text_converter,
171 "massnahme2_finanzierung": _text_converter,
172 "massnahme_3": _text_converter,
173 "massnahme3_finanzierung": _text_converter,
174 "abgebrochene_massnahmen": _int_converter,
175 "erwerbstaetigkeit_job": _choice_converter,
176 "letzte_taetigkeit": _text_converter,
177 "dauer_1": _int_converter,
178 "austrittsdatum_1": _date_converter,
179 "weitere_taetigkeiten": _int_converter,
180 "weitere_jobs_text": _text_converter,
181 "dauer_weitere_taetigkeiten": _int_converter,
182 "arbeitslosigkeit_1": _choice_converter,
183 "anzahl_arbeitslosigkeit": _int_converter,
184 "dauer_nach_letzter_beschaeftigung": _int_converter,
185 "dauer_insgesamt": _int_converter,
186 "bezug_alg1": _choice_converter,
187 "bezug_alg2": _choice_converter,
188 "wehrpflicht_zivildienst_freiwilligenjahr_1": _choice_converter,
189 "art_des_dienstes": _choice_converter,
190 "dauer_2": _int_converter,
191 "mutterschutz_erziehungsurlaub": _choice_converter,
192 "anzahl": _int_converter,
193 "dauer_letzter_erziehungsurlaub": _int_converter,
194 "dauer_insgesamt_1": _int_converter,
195 "kompetenzfeststellung": _choice_converter,
196 "zielsetzung": _choice_converter,
197 "begleitung": _choice_converter,
198 "welche_vermittlung_nennung": _text_converter,
199 "freie_dokumentation": _text_converter,
200 "bildender_bereich": _bool_converter,
201 "bereich_berufliche_qualifizierung": _bool_converter,
202 "bereich_berufsvorbereitung": _bool_converter,
203 "bereich_lebensbewaeltigung": _bool_converter,
204 "sonstiger_foerderbedarf": _bool_converter,
205 "sonstiger_foerderbedarf_nennung": _text_converter,
206 "foerderzeitraum_start": _date_converter,
207 "foerderzeitraum_ende": _date_converter,
208 "dokumentation_zum_foerderplan": _text_converter,
209 "anzahl_kontakte_termine": _int_converter,
210 "anzahl_der_stunden": _int_converter,
211 "zeitraum_fallmanagement": _int_converter,
212 "beendigung_5": _date_converter,
213 "art_beendigung": _choice_converter,
214 "abbruch_durch": _choice_converter,
215 "gruende_abbruch": _choice_converter,
216 "gruende_sonstiges_nennung_4": _text_converter,
217 "vermittlung": _choice_converter,
218 "vermittlung_nennung": _text_converter,
219 "veraenderungen_rechtskreis": _choice_converter,
220 "allgemein_bildender_schulabschluss": _choice_converter,
221 "allgemein_bildender_schulabschluss_sonstiges_nennung": _text_converter,
222 "massnahmeabschluss": _choice_converter,
223 "schulart": _choice_converter,
224 "schule_sonstiges_nennung": _text_converter,
225 "klassenstufe_1": _int_converter,
226 "ausbildung": _choice_converter,
227 "ausbildung_sonstiges_nennung": _text_converter,
228 "umschulung": _choice_converter,
229 "umschulung_nennung": _text_converter,
230 "arbeitstaetigkeit": _text_converter,
231 "erwerbstatus": _choice_converter,
232 "erwerbsstatus_sonstiges_nennung": _text_converter,
233 "beschaeftigungsumfang": _choice_converter,
234 "kategorien_nichterwerbsarbeit_nichtausbildung": _choice_converter,
235 "kategorien_sonstiges_nennung": _text_converter,
236 "zeitraum_nachbetreuung": _choice_converter,
237 "verbleib_nachbetreuung": _choice_converter,
238 "mitgliedschaft_organisationen_vereinen": _choice_converter,
239 "intensitaet_mitgliedschaft": _choice_converter,
240 "nutzung_kulturangeboten": _choice_converter,
241 "haeufigkeit": _choice_converter,
242 "soziales_engagement": _text_converter,
243 "unternehmungen_freunden": _choice_converter,
244 "unternehmungen_familie": _choice_converter,
245 "peergroup": _choice_converter,
246 "familie_1": _choice_converter,
247 "beziehung": _choice_converter,
248 "arbeit_schule": _choice_converter,
249 "bester_freund_freundin": _choice_converter,
250 "einschaetzung_zielerreichung": _choice_converter,
251 "erreichte_qualifikation": _choice_converter,
252 "integration_ist_nachhaltig": _choice_converter,
253 "selbststaendige_berufswegplanung": _choice_converter,
254 "eigenstaendige_lebensgestaltung": _choice_converter,
255 "soziale_bezugssysteme": _choice_converter,
256 "teilnahme_gesellschaftliches_leben": _choice_converter,
257 "freie_dokumentation_abschlussbewertung": _text_converter
258 },
259 'kompetenzfestellung': {
260 "verfahren_kompetenzfeststellung": _choice_converter,
261 "externeranbieter": _text_converter,
262 "assessment_center": _bool_converter,
263 "interview": _bool_converter,
264 "biografieorientierte_methoden": _bool_converter,
265 "selbsttest_selbstbeurteilung": _bool_converter,
266 "sonstiges_2": _bool_converter,
267 "artdesverfahrens_nennung_sonstiges": _text_converter,
268 "testverfahren": _bool_converter,
269 "intelligenztest": _bool_converter,
270 "intelligenztest_nennung": _text_converter,
271 "schultest": _bool_converter,
272 "schultest_nennung": _text_converter,
273 "leistungstest": _bool_converter,
274 "leistungstest_nennung": _text_converter,
275 "persoenlichkeitstest": _bool_converter,
276 "persoenlichkeitstest_nennung": _text_converter,
277 "einstellungs_interessentest": _bool_converter,
278 "einstellungs_interessentest_nennung": _text_converter,
279 "dauer_des_verfahrens": _choice_converter,
280 "rechenfaehigkeit": _choice_converter,
281 "raeumliches_vorstellungsvermoegen": _choice_converter,
282 "grundverstaendnis_naturwissenschaftlicher_zusammenhaenge": _choice_converter,
283 "logisches_denken": _choice_converter,
284 "wirtschaftliche_grundkenntnisse": _choice_converter,
285 "allgemeine_pc_kenntnisse": _choice_converter,
286 "spezielle_pc_kenntnisse_grafikbearbeitung_musikbearbeitung": _choice_converter,
287 "internet_anwendungen_und_e_mail_kenntnisse": _choice_converter,
288 "andere_medien": _choice_converter,
289 "hand_fingergeschick": _choice_converter,
290 "formauffassung": _choice_converter,
291 "umgang_maschinen_werkzeugen": _choice_converter,
292 "gestalterische_fantasie": _choice_converter,
293 "methoden_der_informationsgewinnung": _choice_converter,
294 "methoden_der_informationsverarbeitung": _choice_converter,
295 "einsatz_lern_und_arbeitstechniken": _choice_converter,
296 "problemloesungsorientierung": _choice_converter,
297 "texte_lesen_und_verstehen": _choice_converter,
298 "texte_schreiben_und_formulieren": _choice_converter,
299 "deutsche_sprache": _choice_converter,
300 "sprache1": _choice_converter,
301 "sprache1_sonstige_nennung": _text_converter,
302 "beherrschung_sprache1": _choice_converter,
303 "sprache2": _choice_converter,
304 "sprache2_sonstige_nennung": _text_converter,
305 "beherrschung_sprache2": _choice_converter,
306 "sprache3": _choice_converter,
307 "sprache3_sonstige_nennung": _text_converter,
308 "beherrschung_sprache3": _choice_converter,
309 "kommunikationsfaehigkeit": _choice_converter,
310 "kritikfaehigkeit": _choice_converter,
311 "konfliktfaehigkeit": _choice_converter,
312 "kreativitaet": _choice_converter,
313 "team_und_kooperationsfaehigkeit": _choice_converter,
314 "solidarisches_verhalten": _choice_converter,
315 "selbstaendiges_lernen_arbeiten": _choice_converter,
316 "selbstreflexion_selbsteinschaetzung": _choice_converter,
317 "verantwortungsuebernahme": _choice_converter,
318 "zielorientierung": _choice_converter,
319 "zuverlaessigkeit": _choice_converter,
320 "altersgerechter_entwicklungsstand": _choice_converter,
321 "gesundheitliche_voraussetzungen": _choice_converter,
322 "konzentration": _choice_converter,
323 "ausdauer": _choice_converter,
324 "durchhaltevermoegen": _choice_converter,
325 "merkfaehigkeit": _choice_converter,
326 "bearbeitungsgeschwindigkeit": _choice_converter,
327 "befaehigung_zu_daueraufmerksamkeit": _choice_converter,
328 "leistungsbereitschaft": _choice_converter,
329 "sorgfalt": _choice_converter,
330 "umgangsformen": _choice_converter,
331 "dokumentation_kompetenzfeststellung": _text_converter
332 },
333 'angebote_bildenden_bereich': {
334 "angebotsform": _choice_converter,
335 "art_der_unterstuetzung": _text_converter,
336 "durchfuehrende_institution": _text_converter,
337 "unterstuetzung_start": _date_converter,
338 "unterstuetzung_ende": _date_converter,
339 "zeitlicher_umfang_unterstuetzung": _int_converter,
340 "beendigung_1": _choice_converter,
341 "beendigung_durch": _choice_converter,
342 "gruende_vorzeitige_beendigung": _choice_converter,
343 "gruende_sonstiges_nennung": _text_converter,
344 "nachweis_bescheinigung": _choice_converter,
345 "sonstiges_nachweis_bescheinigung": _text_converter
346 },
347 'angebote_berufsvorbereitung': {
348 "angebotsform_1": _choice_converter,
349 "art_der_unterstuetzung_1": _choice_converter,
350 "unterstuetzung_sonstiges_nennung": _text_converter,
351 "durchfuehrende_institution_1": _text_converter,
352 "unterstuetzung_start_1": _date_converter,
353 "unterstuetzung_ende_1": _date_converter,
354 "zeitlicher_umfang_unterstuetzung_1": _int_converter,
355 "beendigung_2": _choice_converter,
356 "beendigung_durch_1": _choice_converter,
357 "gruende_vorzeitige_beendigung_1": _choice_converter,
358 "gruende_sonstiges_nennung_1": _text_converter,
359 "nachweis_bescheinigung_1": _choice_converter,
360 "sonstiges_nachweis_bescheinigung_1": _text_converter
361 },
362 'angebote_berufliche_qualifizierung': {
363 "angebotsform_2": _choice_converter,
364 "angebote_im_bereich": _choice_converter,
365 "unterstuetzung_sonstiges_nennung_1": _text_converter,
366 "durchfuehrende_institution_2": _text_converter,
367 "unterstuetzung_start_2": _date_converter,
368 "unterstuetzung_ende_2": _date_converter,
369 "zeitlicher_umfang_unterstuetzung_2": _int_converter,
370 "beendigung_3": _choice_converter,
371 "beendigung_durch_2": _choice_converter,
372 "gruende_vorzeitige_beendigung_2": _choice_converter,
373 "gruende_sonstiges_nennung_2": _text_converter,
374 "nachweis_bescheinigung_2": _choice_converter,
375 "sonstiges_nachweis_bescheinigung_2": _text_converter
376 },
377 'angebote_lebensbewaeltigung': {
378 "angebotsform_3": _choice_converter,
379 "unterstuetzung_angebotsform_sonstiges_nennung": _text_converter,
380 "art_der_unterstuetzung_2": _choice_converter,
381 "unterstuetzung_sonstiges_nennung_2": _text_converter,
382 "durchfuehrende_institution_3": _text_converter,
383 "unterstuetzung_start_3": _date_converter,
384 "unterstuetzung_ende_3": _date_converter,
385 "zeitlicher_umfang_unterstuetzung_3": _int_converter,
386 "beendigung_4": _choice_converter,
387 "beendigung_durch_3": _choice_converter,
388 "gruende_vorzeitige_beendigung_3": _choice_converter,
389 "gruende_sonstiges_nennung_3": _text_converter,
390 "nachweis_bescheinigung_3": _choice_converter,
391 "sonstiges_nachweis_bescheinigung_3": _text_converter
392 }
393 }
394
395 CREATE_FUNCTIONS = {
396 'kompetenzfestellung': 'create_rg_kompetenz_ds',
397 'angebote_bildenden_bereich': 'create_rg_bilden_ds',
398 'angebote_berufsvorbereitung': 'create_rg_beruf_ds',
399 'angebote_berufliche_qualifizierung': 'create_rg_quali_ds',
400 'angebote_lebensbewaeltigung': 'create_rg_leben_ds'
401 }
402
403 EXPECT_CASES = 0
404 EXPECT_CASE = 1
405 EXPECT_RELATION = 2
406 EXPECT_FIELD = 3
407 EXPECT_CHARS = 4
408
409 SQL_UPATE = """UPDATE %s_tbl_view SET %s WHERE uuid_id = %%(uuid_id)s"""
410
411 SQL_GET_MASTER_ID = \
412 """SELECT get_masterid_from_uuid(%(relation_name)s, %(uuid)s)"""
413
414 SQL_CREATE_MASTER_DS = \
415 """SELECT create_master_ds(%(uuid)s)"""
416
417 SQL_SELECT_UUID_FROM_RELATION = \
418 """SELECT uuid_id FROM %s_tbl_view WHERE id = %%(id)s"""
419
420 SQL_CREATE_REPEAT_GROUP = \
421 """SELECT %s(%%(master_id)s, %%(uuid)s)"""
422
423 def get_id_for_uuid(cur, relation_name, uuid):
424 cur.execute(SQL_GET_MASTER_ID, {
425 'relation_name': relation_name, 'uuid': uuid })
426 row = cur.next()
427 if not row: return None
428 return row[0]
429
430 def create_master(cur, uuid=None):
431 cur.execute(SQL_CREATE_MASTER_DS, { 'uuid': uuid })
432 row = cur.next()
433 if not row: return None
434 return row[0]
435
436 def create_repeat_group(cur, relation_name, master_id, uuid=None):
437 relation_name = CREATE_FUNCTIONS.get(relation_name)
438 if relation_name is None: return None
439 sql = SQL_CREATE_REPEAT_GROUP % relation_name
440 cur.execute(sql, { 'master_id': master_id, 'uuid': uuid })
441 row = cur.next()
442 if not row: return None
443 return row[0]
444
445 def get_uuid(cur, relation_name, ds_id):
446 if relation_name != 'master':
447 relation_name = "rg_%s" % relation_name
448 sql = SQL_SELECT_UUID_FROM_RELATION % relation_name
449 cur.execute(sql, { 'id': ds_id })
450 row = cur.next()
451 if not row: return None
452 return row[0]
453
454 class Case:
455 def __init__(self):
456 self.relations = []
457
458 def append(self, relation):
459 self.relations.append(relation)
460
461 def find_first_relation(self, relation_name):
462 for relation in self.relations:
463 if relation.name == relation_name:
464 return relation
465 return None
466
467 class Relation:
468
469 def __init__(self, name, items = None):
470 self.name = name
471 if items is None: self.items = []
472 else: self.items = items
473 self.uuid = None
474 self.fields = []
475
476 def append(self, field):
477 self.fields.append(field)
478
479 def find_field(self, field_name):
480 for k, v in self.fields:
481 if k == field_name:
482 return v
483 return None
484
485 def set_field(self, field_name, value):
486 for i in xrange(len(self.fields)):
487 field = self.fields[i]
488 if field[0] == field_name:
489 field[1] = value
490 return
491 self.fields.append((field_name, value))
492
493 def update(self, cur):
494 if self.uuid is None:
495 raise StandardError("UUID is not defined")
496 sets = []
497 values = {}
498 for k, v in self.fields:
499 sets.append("%s = %%(%s)s" % (k, k))
500 values[k] = v
501
502 values['uuid_id'] = self.uuid
503
504 if self.name != 'master': rel = "rg_%s" % self.name
505 else: rel = "master"
506
507 sql = SQL_UPATE % (rel, ", ".join(sets))
508 cur.execute(sql, values)
509
510
511 class XMLHandler(DefaultHandler):
512
513 def __init__(self, case_store):
514 DefaultHandler.__init__(self)
515 self.mode = EXPECT_CASES
516 self.ignore = 0
517 self.relation = None
518 self.chars = None
519 self.case_store = case_store
520 self.case = None
521
522 def startElement(self, name, attrs):
523 if self.mode == EXPECT_CASES:
524 if name != "cases":
525 print >> sys.stderr, "ignore %s" % name
526 self.ignore += 1
527 else:
528 self.mode = EXPECT_CASE
529
530 elif self.mode == EXPECT_CASE:
531 if name != "case":
532 print >> sys.stderr, "ignore %s" % name
533 self.ignore += 1
534 else:
535 self.case = Case()
536 self.mode = EXPECT_RELATION
537
538 elif self.mode == EXPECT_RELATION:
539 rel = RELATIONS.get(name)
540 if rel is None:
541 print >> sys.stderr, "relation '%s' not found" % name
542 self.ignore += 1
543 else:
544 #print >> sys.stderr, "relation '%s' found" % name
545 self.relation = Relation(name, rel)
546 self.mode = EXPECT_FIELD
547
548 elif self.mode == EXPECT_FIELD:
549 self.mode = EXPECT_CHARS
550 self.chars = ""
551
552 elif self.mode == EXPECT_CHARS:
553 self.ignore += 1
554
555 def endElement(self, name):
556 if self.ignore > 0:
557 self.ignore -= 1
558 return
559
560 if self.mode == EXPECT_CHARS:
561 if name != "uuid_id":
562 converter = self.relation.items.get(name)
563 if converter is None:
564 print >> sys.stderr, "missing converter for %s" % name
565 else:
566 if not self.chars:
567 self.relation.append([name, None])
568 else:
569 #print >> sys.stderr, "convert %s" % name
570 self.relation.append([name, converter(self.chars)])
571 else:
572 self.relation.uuid = self.chars.strip()
573 #print >> sys.stderr, "uuid: %s" % self.relation.uuid
574
575 self.mode = EXPECT_FIELD
576 self.chars = None
577
578 if self.mode == EXPECT_FIELD:
579 if self.relation and self.relation.name == name:
580 self.case.append(self.relation)
581 self.relation = None
582 self.mode = EXPECT_RELATION
583 else:
584 pass
585
586 elif self.mode == EXPECT_RELATION:
587 if name == "case":
588 self.case_store.store(self.case)
589 self.case = None
590 self.mode = EXPECT_CASE
591
592 elif self.mode == EXPECT_CASE:
593 if name == "cases":
594 self.mode = EXPECT_CASES
595
596 def characters(self, content):
597 if self.mode == EXPECT_CHARS:
598 self.chars += content
599
600 class CaseStore:
601
602 def __init__(self, con, cur, fkz):
603 self.con = con
604 self.cur = cur
605 self.fkz = fkz
606
607 def store(self, case):
608
609 success = False
610 master_new = False
611 kompetenz_new = False
612 master_id = None
613 cur = self.cur
614
615 try:
616 # find master
617 master = case.find_first_relation('master')
618
619 if master is None:
620 # need to create one
621 master_id = create_master(cur)
622 master_new = True
623 if self.fkz:
624 master = Relation('master')
625 master.uuid = get_uuid(cur, 'master', master_id)
626 master.append(['fkz', self.fkz])
627 master.update(cur)
628 else:
629 # we have a master
630 if master.uuid is None:
631 # need to create new one
632 master_id = create_master(cur)
633 master_new = True
634 master.uuid = get_uuid(cur, 'master', master_id)
635 if self.fkz:
636 master.set_field('fkz', self.fkz)
637 else:
638 # we have a uuid
639 master_id = get_id_for_uuid(cur, 'master', master.uuid)
640 if master_id is None:
641 # does not exist -> create new
642 master_id = create_master(cur, master.uuid)
643 master_new = True
644 if self.fkz:
645 master.set_field('fkz', self.fkz)
646 # update the master
647 master.update(cur)
648
649 # now handle the repeat groups
650 for relation in case.relations:
651 if relation.name == 'master':
652 # masters are already handled
653 continue
654
655 if relation.uuid is None:
656 # need to create new
657 relation_id = create_repeat_group(cur, relation.name, master_id)
658 relation.uuid = get_uuid(cur, relation.name, relation_id)
659 if relation.name == 'kompetenzfeststellung':
660 kompetenz_new = True
661 else:
662 # we have a UUID. find out if we have this entry already in our database
663 m_id = get_id_for_uuid(cur, relation.name, relation.uuid)
664 if not m_id is None and m_id != master_id:
665 # exists but not the right master -> ignore
666 continue
667
668 if m_id is None:
669 # create new
670 relation_id = create_repeat_group(cur, relation.name, master_id, relation.uuid)
671 if relation.name == 'kompetenzfeststellung':
672 kompetenz_new = True
673
674 # update the relation
675 relation.update(cur)
676
677 if master_new and kompetenz_new:
678 # create at least one kompetenzfeststellung if there is a new master
679 create_repeat_group(cur, 'kompetenzfeststellung', master_id)
680
681 success = True
682 self.con.commit()
683
684 finally:
685 if not success:
686 self.con.rollback()
687
688 def main():
689 try:
690 opts, args = getopt.getopt(sys.argv[1:], "d:p:h:u:f:w:", (
691 "database=",
692 "port=",
693 "host=",
694 "user=",
695 "fkz=",
696 "password="))
697 except getopt.GetoptError, err:
698 sys.stderr.write("error: %s\n" % str(err))
699 sys.exit(1)
700
701 DBNAME = "ka_inte00002_db"
702 HOST = "localhost"
703 PORT = 5432
704 USER = "postgres"
705 FKZ = None
706 PASSWORD = ""
707
708 for o, a in opts:
709 if o in ("d", "-d", "--database"):
710 DBNAME = a
711 elif o in ("p", "-p", "--port"):
712 PORT = int(a)
713 elif o in ("h", "-h", "--host"):
714 HOST = a
715 elif o in ("u", "-u", "--user"):
716 USER = a
717 elif o in ("f", "-f", "--fkz"):
718 FKZ = a
719 elif o in ("w", "-w", "--password"):
720 PASSWORD = a
721
722 con, cur = None, None
723 try:
724 con = dbapi.connect(
725 database = DBNAME,
726 #port = PORT,
727 #host = HOST,
728 user = USER)
729 #password = PASSWORD)
730
731 cur = con.cursor()
732 case_store = CaseStore(con, cur, FKZ)
733
734 handler = XMLHandler(case_store)
735 parse(sys.stdin, handler)
736 finally:
737 if cur:
738 try: cur.close()
739 except: pass
740 if con:
741 try: con.close()
742 except: pass
743
744 if __name__ == '__main__':
745 main()
746
747 # vim:set ts=4 sw=4 si et sta sts=4:

Properties

Name Value
svn:executable *

[email protected]
ViewVC Help
Powered by ViewVC 1.1.26