Sie sind nicht angemeldet.

Werbung

Boote kaufen

Windstärken

Windstärkentabelle

ArAl

Seebär

Beiträge: 1 310

Wohnort: Lünen (bei Dortmund)

Schiffsname: Elas

Bootstyp: Beneteau Oceanis 44 CC

Heimathafen: Flensburg, Liegeplatz: Murter

Rufzeichen: DLKU

MMSI: 211810580

  • Nachricht senden

21

Donnerstag, 7. Mai 2020, 20:05

Das ging sehr schnell ohne Programmierkenntnisse.
Das Jahr 1904 beginnt mit 23 Ausgaben und insgesamt 579 Seiten. Und dann kommen nur noch die 78 Folgejahre bis 1981.

Das Inhaltsverzeichnis und die Schlagworte sind in der Datenbank für die Suchmaschine und sollten auch in die PDF-Dateien eingearbeitet werden.

Ist nicht unser Problem, aber dieses Projekts wäre etwas komplexer und ohne Programmierung nicht zu stemmen.

schwattwitt

Salzbuckel

Beiträge: 3 135

Wohnort: Ecklak 53°57'0.82"N, 9°14'43.87"E

  • Nachricht senden

22

Donnerstag, 7. Mai 2020, 20:08

Ok, dann sind das andere Dimensionen als vermutet…

jensstark

Salzbuckel

Beiträge: 8 726

Wohnort: Halstenbek

Schiffsname: Moi

Bootstyp: Dehler Optima 98GS

Heimathafen: Nestleweg 8, Kappeln

Rufzeichen: DB8094 / (DB9MOI)

  • Nachricht senden

23

Donnerstag, 7. Mai 2020, 23:56

Das Jahr 1904 beginnt mit 23 Ausgaben und insgesamt 579 Seiten. Und dann kommen nur noch die 78 Folgejahre bis 1981.

Das Inhaltsverzeichnis und die Schlagworte sind in der Datenbank für die Suchmaschine und sollten auch in die PDF-Dateien eingearbeitet werden.

Ist nicht unser Problem, aber dieses Projekts wäre etwas komplexer und ohne Programmierung nicht zu stemmen.


Der klassische Weg wäre ein Workflow:

Pro Heft die entsprechenden JPGs in ein PDF packen, OCR 'drüber, Text hinter Graphik lesen, gleichzeitig in Konkordanz aufnehmen.
Problem ist die OCR-Qualität. Wenn die JPGs nichts taugen, ist das Ganze von mäßigem Wert - und niemand wird manuelle Korrekturen bezahlen wollen.
Der Rest ist, so man denn weiß, was man tut - und eine brauchbare OCR-Engine hat - mehr oder weniger eine Fingerübung.
DAS wäre ohne großen Aufwand zu machen. Wenn's erst einmal läuft, tuckert das vor sich hin.

24

Freitag, 8. Mai 2020, 07:52

Ich habe es auch ab und an genutzt. Wenn ich mich recht entsinne war eine Text oder zumindest Schlagwortsuche schon möglich. Dann wäre OCR, was leider auch schon oft bei guter Bildqualität versagt, vielleicht "Nice to have", aber nicht zwingend nötig.
Das man früher auf JPEG als Format gesetzt hat, kann damals durchaus eine sinnvolle Entscheidung gewesen sein. Speicherplatz war knapp und teuer. Man brauchte auch keine zusätzlichen Lizenzgebühren für Software.
Kleiner werden die Dateien als PDF auch nicht (zumindest bei gleichem Qualitätsniveau). Höchstens wenn man allen Text als Text einsetzt, aber das hieße alle Ausgaben komplett neu nachzubauen. Aber das wäre ein Projekt, dessen Fertigstellung ich wohl icht mehr erleben würde.
Hoffentlich ist es bald wieder online verfügbar.

25

Freitag, 8. Mai 2020, 18:51

Warum meldest du das nicht im FKY Forum?


Im FKY Forum sind keine Antworten zu erwarten. Habe in der Vergangenheit schon in den verschiedensten Kategorien dort gepostet, nie eine Antwort oder eine Reaktion erhalten, das Ding ist wie tot, habe ich für mich abgehakt.
Gruß Peter

- Ein Segel reicht schon -

www.catboot-seezunge.de

26

Samstag, 24. Oktober 2020, 20:05

Hallo

für längere Coronaabende vor dem PC:
Macht aus den jpg Dateien eine pdf Datei, ladet sie dann in Google drive hoch und wandelt sie dort in eine Google Textdokument um.
das Ergebnis ist nicht übel, aber halt auch nicht perfekt Eher mal eine Spielerei
Viele Grüße
Tom

27

Freitag, 8. Januar 2021, 14:18

Ich kann die Seite mit dem Yacht-Archiv zwar (wieder) aufrufen, über die Stichwortsuche auch das Gesuchte finden, aber nur die Seite des Treffers öffnen. Beispielsweise wird zu einem gesuchten Boots-Test angezeigt: Jahrgang X, Heft Y, Seite soundsoviel. Diese Seite kann ich dann auch öffnen und lesen, aber die Folgeseite, auf der der Test weitergeht, finde ich nicht. Früher waren alle Seiten des Hefts mit Seitenzahlen aufgelistet, jetzt sehe ich das nicht mehr, nur ungefähr jede dritte Seite. Geht das nur mir so, bin ich zu doof dazu?

Ähnliche Themen

Counter:

Gezählt seit: 4. Februar 2014, 08:39, nur eingeloggte Mitglieder
 Zugriffe:   Hits heute: 92   Hits gestern: 3 111   Hits Tagesrekord: 12 076   Hits gesamt: 6 206 521   Hits pro Tag: 2 439 
 Seitenaufrufe:   Klicks heute: 480   Klicks gestern: 20 953   Klicks Tagesrekord: 154 353   Klicks gesamt: 47 292 877   Klicks pro Tag: 18 584,82 

Kontrollzentrum