You're not registered yet. Click here to register. Credits 
You can register here for free.
This topic has 82 replies
and has been read 4.878 times
 De verbis in indicem latin.dic referendis
pages 1 | 2 | 3 | 4 | 5 | 6
Bussinchen Offline




Posts: 14

Thu Jul 21, 2011 2:53 pm
#31 RE: Charlton T. Lewis; Charles Short [1879], A Latin Dictionary Quote · reply

Nach langem Suchen habe ich jetzt endlich die Möglichkeit gefunden, den Lewis & Short auch als pdf-File downzuloaden:

Lewis & Short Latin Dictionary.pdf (410,576 KB)

http://www.4shared.com/document/1nE74HBv...Dictionary.html ( --> Link funktioniert nicht mehr, Stand 2012-01-09)
http://www.4shared.com/get/1nE74HBv/Lewi...Dictionary.html ( --> Link funktioniert nicht mehr, Stand 2012-01-09)

http://www.archive.org/stream/LewisShort...age/n0/mode/2up (online, eingescannt)
http://www.archive.org/details/LewisShortLatnDiccionary (Downloads pdf und pdf mit Text)

Vielleicht hilft uns das weiter! Aber Achtung, der Download dauert eine Weile, denn es handelt sich um 410 MB!
Sicher ist diese pdf-Datei als Ergänzung zum Programm ls_latindictionary.exe nicht schlecht!


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


Bussinchen Offline




Posts: 14

Mon Jul 25, 2011 3:40 am
#32 Lateinischer Bibeltext der Vulgata auf http://biblos.com/ Quote · reply

Sehr gut geeignet für Analysen von Wortformen, die in der lateinischen Bibel, der Vulgata, vorkommen, ist die hervorragende Webseite:

http://biblos.com/


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


Bussinchen Offline




Posts: 14

Tue Aug 09, 2011 2:44 am
#33 Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Linhart, hättest du einen Nutzen von diesem Link hier?
Das ist unser L&S (vom Anfang inkl. Buchstabe A), offenbar eingescannt und mithilfe von OCR in ein richtiges Textfile umgewandelt.

http://www.archive.org/stream/LatinDicti...ewis_a_djvu.txt

Siehe auch http://www.archive.org/details/LatinDictionaryA


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.476

Tue Aug 09, 2011 12:00 pm
#34 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Wenn ich richtig sehe, dann sind das nur die Wörter mit Anfangsbuchstaben A. Das bringt natürlich nicht viel.

Der gesamte Lewis & Short als Textfile wäre schon sehr interessant, vor allem, weil man dann auch nach Worten in den Erklärungen suchen könnte. Oft stehen ja dort alternative Formen, die ich bisher nur eher zufällig gefunden habe. Die meisten (akzeptablen) davon dürften allerdings in den Spellcheckerlisten enthalten sein.


linhart Offline




Posts: 2.476

Tue Aug 09, 2011 2:26 pm
#35 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Hier ist ein gutes Beispiel, das zeigt, wie wichtig L&S als durchsuchbarer File wäre:

Aus den Spellchecker-Listen ergibt sich das Wort CEPE einmal unmittelbar und einmal als Form von CEPIS. Keines der beiden Wörter findet man in L&S. Glücklicherweise steht es aber in der Whitaker-Liste (DICTPAGE.RAW), und zwar mit der Bedeutung "onion", also "Zwiebel". Nachschlagen in einem deutsch-lateinischen Wörterbuch (PONS) zeigte mir, das Zwiebel normalerweise CEPA heißt, und das steht nun tatsächlich in L&S, und zwar mit Verweis auf CAEPA, und dort kann man die gleich häufigen ("equally freq.") Formen CAEPE und CEPE finden.

Natürlich hätte ich CEPE gefunden, wenn ich alle vierbuchstabigen Wörter durchgesehen hätte, denn da wäre ich ja auf CEPA gestoßen. Bei den vierbuchstabigen mag das ja vielleicht noch machbar sein, aber bei längeren Wörtern ist das keine gangbare Methode.


Bussinchen Offline




Posts: 14

Tue Aug 09, 2011 4:41 pm
#36 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Ich sehe die Problematik. Schlimm ist das.

Ja, der Link http://www.archive.org/details/LatinDictionaryA mit der OCR-Textversion von L&S bezieht sich leider nur auf den Buchstaben A.

http://www.archive.org/details/LatinDictionaryB führt ins Nichts:
The item you have requested had an error:
Item cannot be found.which prevents us from displaying this page.
If you would like to report this problem as an error report, you may do so here.

Ebenso C und die weiteren Buchstaben. (Ich habe bis einschließlich G getestet.)

Bisher scheint sich also noch niemand die Mühe gemacht zu haben, den L&S komplett mit der OCR-Funktion als Textfile einzuscannen und irgendwo online zu stellen, auch nicht auf http://www.archive.org/. Sehr schade! Hier gäbe es für Uvius & Co. ein wichtiges Betätigungsfeld. Und wir von Scrabble3D hätten einen immensen Nutzen davon.

http://www.archive.org/search.php?query=...diatype%3Atexts


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


Bussinchen Offline




Posts: 14

Tue Aug 09, 2011 4:46 pm
#37 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Zitat von linhart
Hier ist ein gutes Beispiel, das zeigt, wie wichtig L&S als durchsuchbarer File wäre


Wie hilfreich sind hier eigentlich die beiden Diogenes-Files latin-lemmata.txt und latin-analyses.txt, die ja angeblich auf dem L&S basieren?


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.476

Wed Aug 10, 2011 7:48 am
#38 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Die Files latin-lemmata und latin-analysis enthalten im Wesentlichen die Informationen, die das Word Study Tool verwendet (mit allen Fehlern und Ungereimtheiten), jedoch nicht den Text der Worterklärungen von L&S.

Für mich sind diese Files trotzdem sehr nützlich. Z.B. gehe ich jetzt bei den vierbuchstabigen Wörtern so vor, dass ich zunächst mit den Spellcheckerlisten alle erzeuge und dann nur diejenigen genauer ansehe, die nicht in den Diogenes-Files stehen. Ich gehe also davon aus, dass die Wörter, welche in beiden Listen vorkommen, in Ordnung sind. Das wird natürlich nicht 100%-ig stimmen, aber die Wahrscheinlichkeit dürfte doch recht hoch sein, weil allem Anschein nach die Spellcheckerlisten unabhängig von den Diogenes-Listen erstellt wurden.

(Nach demselben Prinzip bin ich ja auch bei der Verbesserung der deutschen Wortlisten vorgegangen. Da waren es die weitgehend unabhängig voneinander erstellten Listen von Gero und Jörg.)


Bussinchen Offline




Posts: 14

Wed Aug 10, 2011 12:30 pm
#39 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

Zitat von linhart
[...] Z.B. gehe ich jetzt bei den vierbuchstabigen Wörtern so vor, dass ich zunächst mit den Spellcheckerlisten alle erzeuge und dann nur diejenigen genauer ansehe, die nicht in den Diogenes-Files stehen. [...] (Nach demselben Prinzip bin ich ja auch bei der Verbesserung der deutschen Wortlisten vorgegangen. Da waren es die weitgehend unabhängig voneinander erstellten Listen von Gero und Jörg.)


Und da hat es sich ja gezeigt, dass diese Methode sehr gut funktioniert hat.
Also gehe ich davon aus, dass diese Methode auch für Latein ein gangbarer Weg sein dürfte.


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


Bussinchen Offline




Posts: 14

Wed Aug 10, 2011 1:22 pm
#40 RE: Lewis & Short - eingescannt und mit OCR in Text umgewandelt Quote · reply

http://www.archive.org/details/LatinDictionaryA mit der OCR-Textversion von L&S ist mit schlimmen Fehlern behaftet

Ich stelle mir in Anbetracht der offenbar noch sehr mangelhaften OCR-Technologie inzwischen die Frage, wie hilfreich solche OCR-Textfiles tatsächlich wären.

Eben habe ich aufgrund einer Stichprobe festgestellt, dass größere Passagen des L&S in der OCR-Version völlig fehlen. Ich wage aber zu behaupten, dass der Fehler nicht auf einer Unachtsamkeit des einscannenden Menschen beruht, sondern gehe vielmehr davon aus, dass die OCR-Funktion die einzuscannenden Passagen einfach nicht erkannt und eingelesen, sondern eigenmächtig übersprungen hat. Dabei kritisiere ich noch nicht einmal die generell mangelhafte Buchstabenerkennung, die zu abstrusen Formen wie z.B. abr-dgatiO statt korrekt abrogatio führt.

Hier das konkrete Beispiel, auf das ich mich beziehe:

Zitat von http://www.archive.org/stream/LatinDicti...ewis_a_djvu.txt

abr-dgatiO, onis,/. [abrogo], a formal
repeal of a law, Cic. Att. 3, 23, 2.

ab-rdgo. iivl, atum, 1, v. a. I. Lit.,
polit. t. t. : to annul in all its parts a
law now in force, to repeal, to abrogate
wholly (whereas derogo means to abro-
gate partly and abrogo to counteract; v.
these verbs), = cwroKupotollere, Front. Dili. 2195 P.; v. rogo (very
freq. in Cic.) : huic legi nee obrogari fas
est, neque derogari ex hac aliquid licet, ne-
que tota abrogari potest, this law cannot
be invalidated by an opposing one, nor
modified, by restrictions, nor wholly re-
pealed Cic" Rep. 3, 22, from which exam-
ple (cf. also id. ib. 2, 37 ; id. Att. 3, 23, 2, and
many others in Liv.) it is evident that abro-
gare was constr. in the classical period with
«cc\, and noLas later, with dat. ; cf. Liv.
9, 34 Drak— M3. Of a civil office : magistra-
tum alicui, to take it from oance
from : ejusmali, Plin.

28, 6, 17, § 63.

absolutus, a , um,
p - «■> frorn

ab-SOlvo. vi, utum, 3, v. a., to loosen
from, to make loose, set free, detach, untie
ters, qs. a vinculis solvere, like vinculis
exsolvere, Plaut. True. 3, 4, 10 ). I. Lit.
(so very rare) : canem ante tempus, Amm.


Wir sehen hier, dass alles, was nach dem von mir blau markierten Passus und vor dem von mir rot markierten Passus stehen müsste, schlichtweg fehlt.
Es handelt sich nicht nur um eine ganze Seite des L&S, die beim Einscannen einfach übersprungen wurde, sondern es wurden auch Einträge bzw. Spalten auf denselben Seiten, wo auch abrogo und absolutus stehen, überhaupt nicht eingelesen. Dies ist für mich ein Indiz dafür, dass nicht der einscannende Mensch aus Versehen eine Seite überblättert hat, sondern dass OCR eine bis dato noch nicht ausgefeilte Technologie ist.
Abgesehen davon kommt es ständig zu Scanfehlern, die auf der falschen Erkennung von Buchstaben und anderen Zeichen beruht, was natürlich damit zu tun haben könnte, dass die Druckversion von L&S keine in heutigen Computerprogrammen gängigen Fonts wie Times New Roman oder Arial, sondern andere, etwas altertümliche Schriftarten verwendet.

Insofern stellt sich mir die Frage, ob es überhaupt viel Sinn machen würde, wenn wir das komplette L&S als OCR-eingescannte Textfiles hätten.

Ich habe diesen Fehler entdeckt, als ich herausfinden wollte, ob die Suche nach dem Kreuz ‡ auf http://www.archive.org/stream/LatinDicti...ewis_a_djvu.txt funktioniert. Als Beispiel wollte ich das Wort ‡ absegmen erfassen, und da stellte ich zu meiner Verwunderung fest, dass dieses Wort gar nicht in der OCR-Liste steht. ‡ absegmen steht nämlich genau in dem Bereich zwischen abrogo und absolutus.

Also vergessen wir die OCR-Scans des L&S. Vergessen wir auch den frommen Wunsch, dass irgendein altruistischer Enthusiast eines Tages OCR-Scans des L&S auf http://www.archive.org hochlädt. Die OCR-Technologie ist IMHO einfach noch nicht ausgereift genug. Maschinelle Erkennung in all Ehren, aber es geht wohl nichts über das menschliche Auge in Verbindung mit dem menschlichen Gehirn...


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble

Attached pictures:
L&S_abrogo.jpg   L&S_absolutus.jpg  
Show as slideshow

Bussinchen Offline




Posts: 14

Wed Aug 10, 2011 3:54 pm
#41 RE: Lewis & Short - online dictionary Quote · reply

http://archimedes.fas.harvard.edu/ --> Auf den Link Pollux klicken -->

http://archimedes.fas.harvard.edu/pollux/

Es muss IMHO elektronische Textfiles des L&S geben, denn wie sollte sonst so ein Online-Dictionary funktionieren?

Vielleicht sollten wir uns einfach mal mit einer Mail an den webmaster@archimedes.fas.harvard.edu wenden und fragen, ob wir die txt-Datei bekommen könnten?


Siehe auch die entsprechende deutsche Webseite: http://archimedes2.mpiwg-berlin.mpg.de/archimedes_templates, wo eine Reihe antiker Texte online abrufbar sind.
http://archimedes.mpiwg-berlin.mpg.de/ar...imedes.new.html

L&S online:
http://archimedes.mpiwg-berlin.mpg.de/cg...&id=d003&max=50


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


Bussinchen Offline




Posts: 14

Wed Aug 10, 2011 5:37 pm
#42 RE: Lewis & Short - online dictionary Quote · reply

Hier habe ich vorhin eine weitere lateinische Liste gefunden:

Download morphological forms as CSV files (for use with Gnumeric or Excel):

http://archimedes.fas.harvard.edu/cgi-bin/morph-csv (la für Latein)

Was ist das?

Man weiß ja nicht, wie diese Liste zustandegekommen ist...


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.476

Wed Aug 10, 2011 10:15 pm
#43 RE: Lewis & Short - online dictionary Quote · reply

Zu dem CSV-File: Das scheint eine Liste von Musterwörtern mit allen Beugungsformen zu sein. Ich kann aber nichts damit anfangen.

Da ist mir die Liste la.aff wesentlich lieber.


linhart Offline




Posts: 2.476

Wed Aug 10, 2011 10:17 pm
#44 RE: Lewis & Short - online dictionary Quote · reply

Zu Lewis & Short: Natürlich gibt es elektronische Formen des gesamten Wörterbuchs, sonst könnte ja das heruntergeladene L&S-Programm nicht funktionieren. Das Problem ist nur, dass das anscheinend nur in verschlüsselter Form weitergegeben wird.


linhart Offline




Posts: 2.476

Wed Aug 10, 2011 10:22 pm
#45 RE: Lewis & Short - online dictionary Quote · reply

Zum Archimedes-Projekt: Da geht es doch um die Geschichte der Mechanik und der Ingenieurwissenschaften. Ich glaube nicht, dass es dort brauchbare allgemeine Wortlisten gibt.


pages 1 | 2 | 3 | 4 | 5 | 6
 Jump  
disconnected Scrabble3D Chat Members online 0
Xobor Einfach ein eigenes Forum erstellen