You're not registered yet. Click here to register. Credits 
You can register here for free.
This topic has 12 replies
and has been read 620 times
 Lewis & Short - Lexikographisches
Bussinchen Offline




Posts: 17

Wed May 16, 2012 1:32 pm
Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Arbeitsthreads zur systematischen Erfassung von Gräzismen, sonstigen Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena im L&S

Vorangehende Diskussion zur Planung der entsprechenden Threads

Wie wir wissen, gibt es in Glossa.exe bzw. der digitalisierten Form des lateinischen Wörterbuchs von Lewis & Short eine ganze Reihe Digitalisierungsfehler, die uns bei der Erstellung unseres latin.dic sehr zu schaffen machen (siehe hierzu auch Die Zeichen * † †† ‡ im L&S ):
† kennzeichnet griechische Wörter
†† kennzeichnet Wörter aus anderen Sprachen
‡ kennzeichnet Wörter, die nur in Inschriften oder bei den alten Grammatikern vorkommen
* kennzeichnet Wörter, die nur einmal belegt sind (Hapax legomena)


Was wir als besonders schlimm empfinden, ist, dass Hapax legomena, Gräzismen und Wörter aus sonstigen Sprachen sowie Wörter, die nur in Inschriften oder bei antiken Lexikografen und Grammatikern belegt sind, in Glossa.exe nicht korrekt mit den Sonderzeichen gemäß Die Zeichen * † †† ‡ im L&S gekennzeichnet sind. Daher tut ein händisches Durchgehen der pdf-Version des L&S not. Linhart hat, wie er mir berichtete, bereits angefangen, die pdf-Datei händisch durchzuackern, um diese markierten Wörter in einer Liste zu erfassen, aber da es sich insgesamt um über 2000 Seiten handelt, ist es unmenschlich, den armen Linhart mit dieser monotonen Arbeit allein zu lassen. Linhart schrieb mir zwar in einer privaten Mail: "Die pdf-Datei durchackern: Ich glaube, das ist nichts für dich. Du solltest deine Zeit besser nützen. Irgendwie werde ich es schon schaffen. Immerhin bin ich schon auf Seite 255." - aber ich denke, dass ich schon zwischendurch immer mal ein paar Seiten des L&S durchsehen und die markierten Wörter sammeln kann, wenn ich gerade nichts Wichtigeres zu tun habe. Positiv ist, dass es sich bei dieser Arbeit sogar lohnt anzufangen, wenn man nur 5 Minuten Zeit hat - eine Seite kann man allemal durchsehen. Und wie gesagt: Steter Tropfen höhlt den Stein! Wenn ich diese Arbeit systematisch angehe, z.B. hier übers Forum, dann glaube ich, kann ich doch mein Scherflein dazu beitragen, dass es ein bisschen schneller vorangeht, wenn man hier überhaupt von "schnell" reden kann, und - was mir das Wichtigste ist - ich kann dem lieben Linhart das Gefühl geben, dass er nicht allein gelassen wird...


Linhart, sag mir mal, wie du es gern hättest. Ich würde hier in diesem Forumsbereich Lewis & Short - Lexikographisches gern vier verschiedene Threads starten, und zwar je einen für folgende Markierungen:
† kennzeichnet griechische Wörter
†† kennzeichnet Wörter aus anderen Sprachen
‡ kennzeichnet Wörter, die nur in Inschriften oder bei den alten Grammatikern vorkommen
* kennzeichnet Wörter, die nur einmal belegt sind (Hapax legomena)

Sag mir bitte, ob diese vier Threads notwendig sind, oder ob du z.B. schon alle Wörter mit Asterisk (* = Hapax legomena) erfasst hast und ob es sich bei den noch nicht erfassten Wörtern tatsächlich nur um die Gräzismen und sonstigen Fremdwörter handelt. Sag mir also, nach welchen Markierungen ich Ausschau halten müsste. Sag mir bitte auch, ob es reicht, wenn ich nur jeweils das fettgedruckte, markierte Stichwort aufliste oder ob du den gesamten Artikel aus Glossa.exe zitiert haben möchtest.

Ich könnte mir vorstellen, im Zählwerk des Adobe Reader z.B. auf Seite 1009 der pdf-Datei mit dem J anzufangen (JACE). Dann könntest du ungestört dort weitermachen, wo du bereits angelangt bist (du hattest ja beim A angefangen), und wir zwei würden uns nicht gegenseitig ins Gehege kommen und aus Versehen dieselbe Arbeit doppelt verrichten, was ja nun der allergrößte Schwachsinn wäre.

Ich würde die Listen in meinen Postings immer durch Editieren ergänzen, wenn ich ein paar neue Seiten des pdf-Files des L&S durchsehe. Neue Postings würde ich vor allem dann anfangen, wenn sich ein logischer Einschnitt ergibt, wie z.B. ein neuer Anfangsbuchstabe o.Ä. Oder aber wir machen es so, dass ich jeweils ein Posting z.B. für jeweils 50 oder 100 durchgesehene pdf-Seiten veranschlage. Das Ganze soll ja auch übersichtlich werden.

Was hältst du davon, Linhärtchen? Wäre das nicht etwas?


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.493

Wed May 16, 2012 2:49 pm
#2 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Das ist wirklich sehr lieb von dir, dass du mir da helfen willst. Ich sehe aber einige Probleme. Ich muss ja letztlich die Kategorien in meine Liste myLa4.txt (=Modifikation der Spellcheckerliste) eintragen, die die Basis für das latin.dic darstellt. Es ist nicht sinnvoll, wenn du auch direkt in diese Liste etwas einträgst, weil ich sie ja täglich bearbeite, um insbesondere die neunbuchstabigen Wörter mit L&S abzugleichen. Wenn du aber eine oder mehrere eigene Listen anlegst, dann muss ich deren Inhalt irgendwann in das myLa4.txt übertragen, und das geht leider nicht vollautomatisch, vor allem aus zwei Gründen:

1. In myLa4.txt stehen nicht nur Lemmata, sondern auch gewisse Genitive und Perfektformen als eigene Einträge. Du müsstest also bei jedem Wort, das du in eine bestimmte Kategorie geben willst, nachsehen, welche Formen davon in myLa4.txt stehen.

2. Es kommt oft vor, dass zwei Lemmata gleich lauten, sich aber in der Deklination oder Konjugation unterscheiden. Das ist in myLa4.txt durch Beugungscodes zu erkennen. Es wäre aber sehr aufwändig, aus den Einträgen im L&S automatisch die Beugungscodes zu erzeugen. D.h. du müsstest in deinen Listen die Beugungscodes eintragen, indem du jeweils in myLa4.txt nachsiehst.

Durch diese beiden Punkte würde sich dein Arbeitsaufwand beträchtlich erhöhen.

Insgesamt denke ich daher, dass du mir nur mit unverhältnismäßig großem Aufwand helfen könntest. Daher solltest du es lieber nicht tun. Ich danke dir trotzdem sehr für diesen Vorschlag.

Du kannst mir sicher viel mehr helfen, wenn du wie bisher bezüglich problematischen Wörtern recherchierst.


Bussinchen Offline




Posts: 17

Wed May 16, 2012 3:20 pm
#3 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Wenn ich dich recht verstehe, würde sich der Arbeitsaufwand für dich also nicht erheblich reduzieren, wenn du Listen bekämst, in denen z.B. alle als Gräzismen markierten Wörter stehen, die du dann deinerseits "nur" in deine myLa4.txt übertragen müsstest???
Hm, das scheint mir alles recht kompliziert zu sein, wie du da mit deinem Programm Mathematica arbeitest...

Ich dachte halt, wenn ich hier mal 5 Minuten habe und dort mal 10 Minuten habe, dann kann ich "stupide" und ohne große geistige Anstrengung weitermachen und markierte Wörter sammeln, Seite für Seite. Wegen 5 oder 10 Minuten fange ich aber nicht mit meinen Recherchen an, wenn es um schwierige Stellungnahmen zu fraglichen Wörtern geht. Da will ich schon wesentlich mehr Zeit haben, damit ich auch dabei bleiben kann und nicht immer aus dem Zusammenhang herausgerissen werde...


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.493

Wed May 16, 2012 4:08 pm
#4 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Ja, es ist so: Das Übertragen von einer von dir erstellten Liste ist ungefähr gleich viel Arbeit wie das Eintragen auf Grund des L&S.

Die einzige sinnvolle Möglichkeit wäre meiner Meinung nach, dass ich dir z.B. eine Hälfte von myLa4.txt gebe und du dort direkt die Kategorien eintragen kannst. Das geht aber frühestens, wenn ich mit den 9-Buchstabern fertig bin, also in drei bis vier Wochen. Vielleicht sollten wir dann weiter überlegen.


Bussinchen Offline




Posts: 17

Wed May 16, 2012 4:12 pm
#5 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

OK. Verstanden.

Dann brauche ich von dir aber genaueste Instruktionen, wie ich vorgehen muss, damit ich nix kaputt mache in dieser Datei!
Mal schauen.


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.493

Sun Aug 12, 2012 8:34 am
#6 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Christoph Haenel hat mir mit seiner OCR-Erkennung der Kreuze etc. schon sehr geholfen. Trotzdem muss ich mehr oder weniger alles einzeln nachkontrollieren. Besonders stört mich dabei, dass die Markierungen im L&S nicht besonders gewissenhaft angebracht worden sind. Immer wieder finde ich z.B. eindeutig griechische Wörter, die nicht als solche markiert sind.

Der Gipfelpunkt der mangelnden Gewissenhaftigkeit dürfte aber die Einstufung von MEUS als griechisches Fremdwort sein:



Anscheinend hat sich hier das tatsächlich aus dem Griechischen kommende Wort meum auf meus ausgewirkt.

*seufz*


linhart Offline




Posts: 2.493

Sun Aug 12, 2012 8:40 am
#7 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Das Bild im vorigem Beitrag wurde zunächst wegen eines Fehlers des Bilder-Hochladeprogramms nicht angezeigt.
Nachdem ich es heute (13. 8. 2012) nochmals hochgeladen hatte, funktionierte es jedoch.


Bussinchen Offline




Posts: 17

Sun Aug 12, 2012 1:13 pm
#8 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

.


Zitat von linhart
Ich weiß nicht, warum im vorigen Beitrag das Bild nicht angezeigt wird. Es sollte die Artikel meum und meus aus der pdf-Version des L&S zeigen.



Auch ich hatte gestern Abend/Nacht massive Probleme mit http://www.bilder-hochladen.net. Was ich auch hochlud, immer wurden nur rote Kreuze angezeigt, und das auch schon in den Mails mit den Links, die man unmittelbar nach Beendigung des Hochladevorgangs immer von Bilder-hochladen.net bekommt. Ich gehe davon aus, dass Bilder-hochladen.net ein Problem mit seinem Server (seinen Servern) hat. Ich werde das Problem nachher im Xobor-Support-Forum melden, falls dieses Problem auch heute weiterhin besteht. Jedenfalls hast du, lieber Linhart, nichts falsch gemacht. Der Fehler liegt eindeutig bei Bilder-hochladen.net.

Man kann Bild-Dateien ja auch direkt im Forum hochladen und seit nicht allzu langer Zeit per Klick auf den Link unter Neu Hochgeladene Dateien direkt in die Forenbeiträge an der Stelle, wo sich der Cursor befindet, einbinden, statt sie nur als kleine, anklickbare Thumbnails im Anhang anzeigen zu lassen. Allerdings funktioniert unter bestimmten Umständen das Einbinden im Internet Explorer 8 nicht so, wie es sein sollte. Im Firefox, IE9 und anderen Browsern funktioniert es aber korrekt. Ich weiß ja nicht, was du für einen Browser verwendest. Wenn man ein Bild in voller Größe anzeigen lassen will, dann muss die Syntax jedenfalls so sein:
[[File:Beispielbild.jpg|none|fullsize]]
und das geht im mittlerweile veralteten Browser IE8 (unter bestimmten Umständen, die zu erklären hier zu weit führen würde) nicht automatisch per Dialogfenster. Man muss diesen Zusatz |none|fullsize dann eben manuell eintragen.

Wenn du nur auf den Link klickst, ohne dass danach |none|fullsize innerhalb der eckigen Klammmern steht, dann wird nur ein Thumbnail eingebunden.
Syntax: [[File:Beispielbild.jpg]]

Allerdings ist es nicht möglich, ins Forum hochgeladene Bilder, die mithilfe dieses Codes eingebunden werden, noch einmal zu verlinken, denn die sind durch den Forencode bereits verlinkt. Es ist also nicht möglich, das hier zu machen:
[URL=http://Beispiellink.org][[File:Beispielbild.jpg]][/URL].
Da ich aber genau das immer machen will, wenn ich z.B. meine Screenshots von den Büchern, wo textkritische Apparate aufscheinen, mit den von mir selbst gewählten Webseiten verlinken will, muss ich trotz der Hochlade- und Einbindmöglichkeit innerhalb des Forums trotzdem auf Bilder-hochladen.net zurückgreifen. Da http://www.bilder-hochladen.net/ gestern Abend und Nacht aber nicht funktionert hat, sah ich mich gezwungen, wieder mal auf http://imageshack.us/ auszuweichen, obwohl mir mittlerweile der Service von unserem Miranusschen Bilderhochladen.net lieber ist als der des amerikanischen Hosters Imageshack.us.


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


Bussinchen Offline




Posts: 17

Sun Aug 12, 2012 1:35 pm
#9 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

.


Adminatrix: Ich habe den Fehler bei Bilder-hochladen.net eben gemeldet:

http://www.hpm-support.de/t532590f117691...html#msg7222320




[EDIT - Adminchen, 2012-08-11, 22:45]

Adminatrix: Der Fehler bei Bilder-hochladen.net ist behoben.

http://www.hpm-support.de/t532590f117691...html#msg7222342


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.493

Sun Aug 12, 2012 1:43 pm
#10 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Danke!

Ich schätze aber, dass frühestens morgen etwas repariert wird, weil ja heute Sonntag ist.


Bussinchen Offline




Posts: 17

Sun Aug 12, 2012 2:07 pm
#11 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Zitat von linhart im Beitrag #6
Der Gipfelpunkt der mangelnden Gewissenhaftigkeit dürfte aber die Einstufung von MEUS als griechisches Fremdwort sein. [...]
*seufz*


Da hast du Recht, mi miser Iohannes!

Dass die Lautung der Possessivpronomen im Griechischen (ἐμός, ἐμή, ἐμόν, mein) und im Lateinischen (meus, mea, meum) die enge indogermanische Verwandtschaft dieser beiden Sprachen sehr deutlich erkennen lässt, ist unbestritten. Darauf weist ja auch Georges hin. So weit zu gehen, dass man meus, mea, meum als Gräzismus einstuft, halte ich aber genau wie du für absurd. Meines Erachtens handelt es sich hier wieder mal um einen üblen Fehler im L&S. Du bist einmalig, mi care Iohannes Linharte ex L&S , dass du immer wieder solche gravierenden Fehler im L&S aufspürst!




ἐμός, ἐμή, ἐμόν --> http://www.zeno.org/Pape-1880/K/Pape-1880----01-0809 (Pape)

• meus, mea, meum --> http://www.zeno.org/Georges-1913/K/Georges-1913-02-0912 (Georges)


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


linhart Offline




Posts: 2.493

Thu Oct 25, 2012 11:29 am
#12 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Ich habe jetzt die in L&S mit einem Kreuz markierten Wörter so ziemlich vollständig erfasst und im latin.dic in die Kategorie 1 gegeben. Leider ist die Kennzeichnung im L&S teilweise problematisch bis falsch, wie schon an obigem Beispiel "meus" sichtbar wurde. Andere solche Beispiele sind mus (siehe MUS) und nurus (siehe NURUS).

Ich kann natürlich nicht jeden L&S-Artikel mit Kreuz eingehend studieren. Außerdem ist mir nicht klar, wo eigentlich die Grenze zwischen Fremdwort und Nicht-Fremdwort ist.

Ich werde daher einfach immer, wenn mir ein Problemfall auffällt, etwas hier bzw. im alphabetischen Teil posten.


Bussinchen Offline




Posts: 17

Fri Oct 26, 2012 3:03 am
#13 RE: Erfassung von Gräzismen, Fremdwörtern, Wörtern aus Inschriften / bei Grammatikern, Hapax legomena Quote · reply

Tüchtig, Linhärtchen, tüchtig!

Ich glaube, die Grenze zwischen Fremdwort und Nichtfremdwort lässt sich auch gar nicht so eindeutig ziehen, wie wir z.B. auch im Deutschen am Beispiel des Wortes Frack gesehen haben.

Du tust daher gut daran, die Problemfälle hier zu posten.


I OpenSource!
• Scrabble3D Download: Sourceforge.net | • Scrabble3D Help: Wiki | • Scrabble3D News: Twitter | • Scrabble3D Fanship: Facebook
• Scrabble3D in Italia: Sezione Scrabble3D sul Forum della Federazione Italiana Gioco Scrabble


 Jump  
disconnected Scrabble3D Chat Members online 0
Xobor Einfach ein eigenes Forum erstellen