Diese Webseite verwendet Cookies. Durch die Nutzung der Webseite stimmst Du der Verwendung von Cookies zu. Datenschutzinformationen [x]

Sie sind nicht angemeldet.

Werbung

Boote kaufen

Windstärken

Windstärkentabelle

ArAl

Seebär

Beiträge: 1 030

Wohnort: Lünen (bei Dortmund)

Schiffsname: Elas

Bootstyp: Beneteau Oceanis 44 CC

Heimathafen: Flensburg, Liegeplatz: Murter

Rufzeichen: DLKU

MMSI: 211810580

Im Marktplatz: 1

  • Nachricht senden

21

Donnerstag, 7. Mai 2020, 20:05

Das ging sehr schnell ohne Programmierkenntnisse.
Das Jahr 1904 beginnt mit 23 Ausgaben und insgesamt 579 Seiten. Und dann kommen nur noch die 78 Folgejahre bis 1981.

Das Inhaltsverzeichnis und die Schlagworte sind in der Datenbank für die Suchmaschine und sollten auch in die PDF-Dateien eingearbeitet werden.

Ist nicht unser Problem, aber dieses Projekts wäre etwas komplexer und ohne Programmierung nicht zu stemmen.

schwattwitt

Salzbuckel

Beiträge: 3 099

Wohnort: Ecklak 53°57'0.82"N, 9°14'43.87"E

  • Nachricht senden

22

Donnerstag, 7. Mai 2020, 20:08

Ok, dann sind das andere Dimensionen als vermutet…

jensstark

Salzbuckel

Beiträge: 8 497

Wohnort: Halstenbek

Schiffsname: Moi

Bootstyp: Dehler Optima 98GS

Heimathafen: Nestleweg 8, Kappeln

Rufzeichen: DB8094 / (DB9MOI)

  • Nachricht senden

23

Donnerstag, 7. Mai 2020, 23:56

Das Jahr 1904 beginnt mit 23 Ausgaben und insgesamt 579 Seiten. Und dann kommen nur noch die 78 Folgejahre bis 1981.

Das Inhaltsverzeichnis und die Schlagworte sind in der Datenbank für die Suchmaschine und sollten auch in die PDF-Dateien eingearbeitet werden.

Ist nicht unser Problem, aber dieses Projekts wäre etwas komplexer und ohne Programmierung nicht zu stemmen.


Der klassische Weg wäre ein Workflow:

Pro Heft die entsprechenden JPGs in ein PDF packen, OCR 'drüber, Text hinter Graphik lesen, gleichzeitig in Konkordanz aufnehmen.
Problem ist die OCR-Qualität. Wenn die JPGs nichts taugen, ist das Ganze von mäßigem Wert - und niemand wird manuelle Korrekturen bezahlen wollen.
Der Rest ist, so man denn weiß, was man tut - und eine brauchbare OCR-Engine hat - mehr oder weniger eine Fingerübung.
DAS wäre ohne großen Aufwand zu machen. Wenn's erst einmal läuft, tuckert das vor sich hin.

24

Freitag, 8. Mai 2020, 07:52

Ich habe es auch ab und an genutzt. Wenn ich mich recht entsinne war eine Text oder zumindest Schlagwortsuche schon möglich. Dann wäre OCR, was leider auch schon oft bei guter Bildqualität versagt, vielleicht "Nice to have", aber nicht zwingend nötig.
Das man früher auf JPEG als Format gesetzt hat, kann damals durchaus eine sinnvolle Entscheidung gewesen sein. Speicherplatz war knapp und teuer. Man brauchte auch keine zusätzlichen Lizenzgebühren für Software.
Kleiner werden die Dateien als PDF auch nicht (zumindest bei gleichem Qualitätsniveau). Höchstens wenn man allen Text als Text einsetzt, aber das hieße alle Ausgaben komplett neu nachzubauen. Aber das wäre ein Projekt, dessen Fertigstellung ich wohl icht mehr erleben würde.
Hoffentlich ist es bald wieder online verfügbar.

25

Freitag, 8. Mai 2020, 18:51

Warum meldest du das nicht im FKY Forum?


Im FKY Forum sind keine Antworten zu erwarten. Habe in der Vergangenheit schon in den verschiedensten Kategorien dort gepostet, nie eine Antwort oder eine Reaktion erhalten, das Ding ist wie tot, habe ich für mich abgehakt.
Gruß Peter

- Ein Segel reicht schon -

www.catboot-seezunge.de

Ähnliche Themen

Counter:

Gezählt seit: 4. Februar 2014, 08:39, nur eingeloggte Mitglieder
 Zugriffe:   Hits heute: 3 236   Hits gestern: 3 346   Hits Tagesrekord: 12 076   Hits gesamt: 5 528 221   Hits pro Tag: 2 400,95 
 Seitenaufrufe:   Klicks heute: 22 976   Klicks gestern: 21 757   Klicks Tagesrekord: 154 353   Klicks gesamt: 42 779 564   Klicks pro Tag: 18 579,5 

Kontrollzentrum