• Willkommen im Forum „Tintenzirkel - das Fantasyautor:innenforum“.
 

Wörter zählen - warum zählt mein Schreibprogramm anders als... ?

Begonnen von Ary, 05. Januar 2010, 14:50:23

« vorheriges - nächstes »

0 Mitglieder und 1 Gast betrachten dieses Thema.

Ary

Hallo,
aufgrund des seltsamen Phänomens, das mir im NaNo pasiert ist (über 50.000 in Open Office und nur 49-haumichtot im Nano-Counter) und aufgrund der Entdeckung, die ich heute beim Rumspielen mit Open Office und Kopfzeilen gemacht habe, hier mal ein Thread zum Phänomen der Wortzahlen an sich und zur Zähltechnik und seltsamen Wortzahl-Phänomenen abhängig vom verwendeten Schreibprogramm.

Maja erklärte mir, Open Office zählt die Wörter der Kopfzeile pro Dokumen nur einmal.
Demnach müsste mir die Kopfzeile in meinem NaNo-Roman auch eigentlich nur einmal zu Buche schlagen, und zwar in folgender Weise:
"Vorname, Name;  Buchtitel, Seitenzahl X von Y".
In meinem konkreten NaNo-Fall wäre das: Name, Vorname; "Schwarze Flügel", Seite 1 von 250" - also maximal 8 Wörter, falls die beiden Zahlen auch als Wörter erkannt werden. Da ich mein ganzes NaNo-Buch (und auch mein derzeitiges T12-Projekt) in einem einzigen Dokument abfasse, müsste diese Kopfzeile ja nur einmal zu Buche schlagen. Im NaNo hatte ich aber eine Diskrepanz von mehr als 1000 Wörtern zwischen Open Office (mit Kopfzeile und Zeilenzahlen) und NaNo-Counter.
An den Zeilenzahlen kann's nicht liegen, die konnte ich wahllos an-und ausschalten, ohne dass sich die Wortzahl veränderte.
Aber wenn weder die Zeilennumerierung noch die Kopfzeile wirklich "Schuld" an der dicken Abweichung war - was war es denn dann? Ich fürchte um meinen schönen T12-Count. der wird sicherlich sinken, wenn ich meinen Text mal in ein anderes Programm umkopiere, oder in ein leeres Open-Office-Dokument.
Ich gebe zu, ich bin ratlos.  ???
Einfach mal machen. Könnte ja gut werden.

Luna

Ich habe gerade mal ein wenig mit OpenOffice experimentiert und bin zu folgendem Ergebnis gekommen:
Beginnt ein Satz mit anführungsstrichen unten - also bei wörtlicher Rede - zählt OpenOffice dieses als ein Wort extra.
Hast du also viel wörtliche Rede im Text, summiert sich das schnell auf.

Ary

Anführungszeichen? Ach du lieber Mist. Ja, ich schreibe recht dialoglastig. Ist ja blöde. ich möchte eigentlich ungern das Schreibprogramm wechseln, mit dem neuen Word 2007 kann ich mich so gar nicht anfreunden.
:schuldig:
Einfach mal machen. Könnte ja gut werden.

Joscha

Das ganze ist aber nur bei gewöhnlichen Anführungszeichen so (was auch erklärt, warum ich beim NaNo kaum Schwierigkeiten mit differierenden Wortzahlen hatte). Wenn du also z.B. gleich die französischen Anführungszeichen verwendest («») passiert das nicht. Die lassen sich ja per Tastenkürzel recht einfach einrichten (bzw. wenn du Linux nutzt sind sie das schon: Alt+y und Alt+x).

Grüße
Joscha

Ary

Hmja, könnte man, aber die mag ich so GAR nicht, wirklich, diese Anführungszeichen stören mich. *seufz* Da steig ich dann wohl doch lieber wieder auf word um. Oder kopiere zumindest um vor dem endgültigen Wörterzählen.

Edith sagt: Ich habe eben mal ein bisschen rumgespielt, Anführungszeichen, auch "normale", werden in meinem OO nicht als Wort mitgezählt, und die Kopfzeile wird tatsächlich nur einmal gezählt.

Langsam versteh ich gaaaaaaaaaaaaaaaaaar nichts mehr.
Einfach mal machen. Könnte ja gut werden.

Maja

Diese »französischen« Anführungszeichen - für diejenigen, die sie mögen - kann man in OpenOffice auch als Standard einrichten, dann kommen sie immer, wenn man die "klassische" Anführungstaste bentutzt.
Da ich unter Linux mit Write or Die schreibe, wo Formatierung ein Fremdwort ist, mache ich es wie von Joscha beschrieben. Früher, als ich mit MS Word gearbeitet habe, hab ich viel auf dem Zahlenblock rumgehackt und die Zeichen über ALT+175 und ALT+174 eingegeben.
Diese Satztzeichen kommen übrigens auch im Buchdruck deutlich häufiger als die von meiner Kollegin "Tüddelchen" genannten Satzzeichen - die brauche ich nur noch beim Coden.

Man muß beim Wortzählen unterscheiden, was genau gezählt wird: Die Worte oder die Lücken dazwischen. Die Nanoseite lt. eigener Aussage zählt die Leerzeichen, da ich unter OO exakt das gleiche Eregebnis hatte, denke ich, es arbeitet genauso. Eine Eigenart von mir in der Zeichensetzung schenkt mir so immer ein paar Extraworte - ich mag es, Nebensätze wie hier mit Gedankenstrich anzuhängen oder einzufügen, und da dieser von Leerzeichen flankitert für sich allein steht, wird er als Wort gezählt, anders als ein direkt am Wort hängendes Komma.
Niemand hantiert gern ungesichert mit kritischen Massen.
Robert Gernhardt

Ary

Huh, Gedankenstriche. Die könnten bei mir ein Knackepunkt sein, da ich sie fast schon inflationär verwende. Aber auch die können eigentlich nicht für eine Diskrepanz von mehr als 1000 Wörtern bei einem ca. 50.000 Wörter langem Dokument sein (ich werde trotzdem mal schauen, wie viele Gedankenstriche der fertige Teil meines NaNo-Buches enthält).
Und wenn OO genau wie der NaNo-Counter die Leerzeichen zählt, um auf die Wortzahl zu kommen, dann können eigentlich ja auch die " ", egal in welcher Form man sie denn nun verwendet, nicht verantwortlich sein, denn sie "kleben" ja auch immer direkt an einem Wort dran.

"Blah,(1) fasel(2)", sagte(3) er(4). - das wären dann 4 Wörter, egal, ob ich die Leerzeichen oder die tatsächlichen Wörter zähle.

Edith: Bin zuhause, hab rumprobiert.
Mein momentanes Projekt hat
in OO mit Kopfzeile: 4685
in OO ohne Kopfzeile: 4676 (passt, wenn ich die Kopfzeile dazuzähle, denn die hat 9 Wörter)
in Word 2007: 4632

Super. Mit was zähl ich denn jetzt im T12, ohne zu "betrügen"?
Einfach mal machen. Könnte ja gut werden.

Luna

Klingt für mich, als bräuchten wir einen offiziellen Counter  ;D
PHP bietet mit str_word_count() auch eine passende funktion. Müsste man mal ausprobieren, inwiefern dieses an den "wahren Wert" herankommt.

Rika

Hmmm, wenn Open Office Anführungszeichen mitzählt, sind es denn dann vielleicht nur die deutschen Afüs *unten*, weil die im Englischen/US-Amerikanischen ja normalerweise nicht benutzt werden?
(Stattdessen werden entweder doppelte Afüs oben sowohl bei Beginn und Ende der wörtlichen Rede genommen, oder einfache Afüs, sozusagen gerichtete Apostrophe, bzw Apostroph und Hochkomma (heißt das so?))

Ich müßte da direkt mal gucken, wie's bei meinem (englischen) Text mit dem Zählen in OO so ist...

Grey

Nach der ganzen Diskussion hier finde ich eins sehr merkwürdig: Bei mir nämlich zählt Word immer ein paar Wörter mehr als OO ... ???

Ary

@Rika, wär lieb, wenn Du das mach checken könntest!

@Grey: bei mir zählt Word weniger, sehr komisch, das alles. Wobei - wenn ich Word schreibe, meine ich inzwischen Word '07, ein anderes habe ich gar nicht mehr, und mein OO ist glaube ich, das aktuellste, das im Moment im Netz herumfliegt.
Einfach mal machen. Könnte ja gut werden.

Rika

Zitat@Rika, wär lieb, wenn Du das mach checken könntest!
Mach ich gern, Aryana, allerdings bestimmt nicht vor Morgen. Ich muß dafür dann einfach mal eine kurze Testdatei erstellen, manuell zählen und Vergleichen. Oder falls du schon eine (kurze) manuell gezählte Datei hast, kannst du sie mir gerne emailen, dann probier' ich's damit.

Ary

Einfach mal machen. Könnte ja gut werden.

Rika

Ok, ich habe getestet. Eine halbe Seite, per hand gezählt = 314 Worte.
Darin:
- 9x wörtliche Rede, normale englische Afüs (die beim Ausdrucken allerdings automatisch in Anfangs- und End-Afüs gewandelt werden, wenn auch nicht nach unter gesetzt.)
- 25 kommas
- 3 x Zusammenziehungen (e.g. don't, can't)
- 1 x Bindestrich-Wort (hatte ich als 1 Wort gezählt)

Open Office zählt 323, sieht also so aus, als ob es definitiv die Afüs sind, egal ob Deutsch oder Englisch.
Ich hab' dann noch getestet und einen Header & Footer eingefügt und geprüft, daß OO beide nur einmal mitzählt, nicht für jede Seite.

Wie doof, denn damit sind wir also wieder bei der Frage, was wir denn nun zum korrekten Zählen benutzen?   ??? :seufz:

(Ach ja, und yWriter, mit dem ich mich noch gar nicht gut auskenne, zählt den einfachen Text, ohne Header-Footer als 316, scheint also das Bindestrich-Wort als 2 zu zählen und den Titel, ohne den's da auch ohne sonstiges Formatieren nicht geht. Wie ich da ggf Header/Footer mache, weiß ich nicht, kann das also nicht testen.)

Lomax

Dann scheint es ja nicht nur vom Programm abzuhängen, sondern auch von der Art der Anführungszeichen, die man verwendet. Ein und dasselbe Programm kann also auch unterschiedliche Ergebnisse liefern, je nachdem, ob man englische, französische oder deutsche Anführungszeichen gebraucht - dass könnte dann auch erklären, warum beispielsweise Grey und Aryana ein unterschiedliches Verhalten bei OO beobachten.

Und die Antwort fürs korrekte Zählen wäre letztendlich wohl, dass es gar kein "korrektes Zählen" gibt, weil jedes Programm irgendwas anderes falsch zählt.