|
|
Mittwoch, 20. Februar 2008
Vor ein paar Jahren habe ich hier einen Text vorgestellt, der mit der Suchmaschine entstanden ist und von einer im Mac eingebauten Stimme vorgelesen oder -gesungen wird: drowned in sorrows, drowned in sounds. Beim Versuch, an dieser Stelle endlich mal ein bisschen weiterzumachen, tauchen Probleme auf.
Die systemeigenen Stimmen auf dem Mac können immer noch kein Deutsch. Man kann sich zwar deutsche Systemstimmen kaufen, die haben aber alle einen Haken, jedenfalls für meine Zwecke. Speechissimo läuft erst gar nicht auf neuen Macs. (Ich habe zwar immer noch System 10.3.9, aber wenn ich mir den Spaß schon kaufe, soll er wenigstens auf dem nächsten Rechner auch noch laufen.) iVox kostet 99 Euro pro Stimme für den privaten Gebrauch und darf vermutlich nicht aufgezeichnet und verbreitet werden etc. Gleiches Manko bei Cepstral. Für privat kostet eine Stimme 30 USD. Die Audio Distribution License hat gestern oder wann das war noch knapp 200 USD gekostet (pro Stimme), was sie heute kostet, ist nicht mehr ausfindig zu machen. Alle diese Stimmen, wenn ich das richtig verstanden habe, baut man bei den Systemstimmen ein, und dann liest diese eine Stimme, die man mal ausgewählt hat, die Texte vor — bis man eben in den Systemerweiterungen eine andere Stimme zum Vorlesen verdonnert. Ich suche aber, und jetzt kommt's!, eine Möglichkeit, einen Text von verschiedenen Stimmen vorlesen zu lassen, "mit verteilten Rollen" so to speak, und zwar auf Deutsch. Vom W3C gibt es Empfehlungen für die Entwickler solcher Programme (z. B. Voice Browser), und was da drin steht, das kommt dem, was ich mir wünsche, ziemlich nahe. Mit einfachen Tags kann man die Stimme bestimmen, die Schnelligkeit, Pausen usw. Die Online-Sprachausgabe von AT & T kann das zum Beispiel schon (mit welchen Tags steht hier: Can the synthesis be modified?). Blöd ist, dass auch dieses Progrämmchen ein paar Fantastillionen kostet: audio wav file broadcast licenses start at $5500. Außerdem scheint mir das doch ein bißchen kanonenhaft für meine Spatzen. Nochmal was ich will in Kürze: - Ein Text-to-speech-Programm für Mac OS 10.3.9 und höher. - Es soll mindestens zwei deutsche Stimmen können. - Es soll mehrere Stimmen in einem Text können, soll also zum Beispiel mit Tags gesteuert werden können. - Die Verbreitungs-Lizenz soll weniger kosten als meiner Oma ihr klein Häuschen. Das ist ziemlich speziell, und ich erwarte nicht ernsthaft eine Antwort hier, aber trotzdem: Hat jemand einen Tipp? (Falls nicht, hab ich hier wenigstens einmal für mich den aktuellen Recherchestand festgehalten.)
(bov um
16 uhr nochwas)
... Comment
isabo, 20. Feb, 17:05
Was geht mit sogenannten "Menschen"?
... Link
bov, 20. Feb, 17:14
Haha, wenn ich mir den Fieberbiber so anhöre, würde ich sagen: viel zu anfällig!
... link
bov, 20. Feb, 17:40
wobei ich die stimme der fieberbiberin sofort klonen würde! wer hat das doch gleich gesungen?
... link ... Comment
seewolf, 20. Feb, 17:26
als Einstiegspunkt
für so eine wissenschaftliche Sprachsynthese MBROLA
Ursprünglich wird da viel zu Fuss gebastelt, um z.B. für wissenschaftliche Untersuchungen neutrale Sprecher zu bekommen, die nicht unbewußt die Lösung verraten. Mittlerweile gibts da wohl ne ganze Wissenschaftler-Szene herum mit haufenweise Tools, vielleicht geht da was. ... Link
bov, 20. Feb, 17:35
Mbrola hab ich hier mal ausprobiert, das klingt nicht besonders gut. Außerdem müsste ich mich da in Unix reingraben, wenn ich das recht verstanden habe. Würde ich gern vermeiden.
... link ... Comment
der ____weiler, 20. Feb, 17:27
Uh, huh. Das ist ein erstaunlich schwieriges Thema; kommerziell existieren sehr gute Angebote, aber die sind teuer.
Eine ziemlich umfangreiche (und ziemlich aktuelle) Zusammenfassung ist hier: ttssamples.syntheticspeech.de Wenn Du absurde Mengen Zeit verbraten kannst, dann kannst Du Dir Deine eigenen Stimme bauen: festvox.org ... Link
der ____weiler, 20. Feb, 17:32
(Man könnte natürlich die Demo-Seiten der verschiedenen Anbieter mit einem Skript melken, wenn man nicht so schrecklich viele Sätze braucht, muss man ein bisschen HTML-scraping code schreiben)
... link
bov, 20. Feb, 17:39
Ah, danke für den Link zu der Zusammenfassung. Bin ich nicht drauf gestoßen, komisch. Werd ich mir mal anschauen.
Festvox: Gilt das gleiche wie bei Mbrola - ich müsste mich in sonstwelche Systemtiefen graben. Das will ich (noch) vermeiden. Demo-Seiten melken, ja, schon, bloß kann ich erstens sowas nicht, und zweitens: Darf man ja nicht. Der Teufel ist ein Eichhörnchen. ... link
der ____weiler, 20. Feb, 17:49
Demo-Seiten melken: ich hab hier noch gammeligen Code rumliegen. Den könnte ich Dir vielleicht anpassen.
Man könnte auch fragen bevor man melkt. ... link ... Comment
der, 20. Feb, 17:39
Versuch's mal mit Mary. Kann dann als Bonus auch Tibetanisch.
Wenn's nicht geht sag Bescheid per mail. ... Link
der, 20. Feb, 19:05
Gerade auch nochmal in die Lizenzen geguckt. Ist ja ganz schön haarige Angelegenheit -- ja, vermutlich bezieht sich das `licensed for non-commercial use only' auch auf die Resultate.
Einfach mal beim DFKI anfragen? Sind freundliche Leute, vielleicht kann man für `artistic use' was raushandeln. ... link ... Comment
mutant, 20. Feb, 18:49
ja, alter trick:
so selbstgebastelte lautschrift verwenden. ... Link ... Comment |
2285 tage
letzte änderung: 22. Jul, 20:29 Status
Youre not logged in ... Login
Menu
Search
Calendar
Recent updates
"Jungrepublikaner" Wenn ich mir McCain /
by goncourt (22. Jul, 20:29)
Skandal! Facebook-Photos und Kommentare von /
by der (22. Jul, 13:33)
Die CIA speichert sicher alle /
by micro_robert (22. Jul, 13:28)
Kann ja gar nix mehr /
by der (22. Jul, 13:05)
Tucholsky: Die Nachfrage bei den /
by bov (22. Jul, 12:06)
aus dem reich der pleonasmen: /
by bov (22. Jul, 11:58)
reli 2.0
by bov (22. Jul, 11:48)
Faecesbuch
by bov (22. Jul, 11:38)
aus dem wörterbuch der denunziation
by bov (22. Jul, 11:36)
Ja, das ist reizend. Interessant /
by modeste (20. Jul, 18:45)
¿general problem solver? (gps *g*) /
by motzes (10. Jul, 16:32)
Hey das stimmt: vgl. die /
by goncourt (10. Jul, 16:26)
Fuzzy Artificial Dumbness (FAD).
by bov (10. Jul, 16:15)
Wobei KU (Künstliche Unintelligenz) der /
by MH (10. Jul, 15:47)
ein programm, das pressemeldungen automatisch /
by bov (10. Jul, 13:34)
"Der Tod des Autors. Journalistische /
by goncourt (10. Jul, 12:40)
mecum is the njuh / /
by bov (10. Jul, 10:56)
Wollen Sie damit zum Ausdruck /
by MH (10. Jul, 10:54)
wie aus gewöhnlich gut unterrichteter /
by bov (10. Jul, 10:49)
"Erschwert wird die Abschiebung im /
by generator (10. Jul, 09:40)
Außer meiner Mutter kenn ich /
by bov (8. Jul, 10:22)
Werden auf diesem Foto demnächst /
by bov (8. Jul, 10:20)
Deren Synonymwörterbuch hätte ich gern.
by schandhase (8. Jul, 01:00)
Na, logen! Die kommen alle /
by bov (7. Jul, 20:26)
Ach Sie, Sie speichern doch /
by kaubeu (7. Jul, 20:12)
|