Wie findet man Wörter, die in der Nähe anderer Wörter stehen?

Question 1

Ich denke, das ist einigermaßen komplex. Es ist ein Zweig der natürlichen Sprachprogrammierung (nicht das andere NLP, Neurolinguistisches Geschwätz). Sie müssen in der Lage sein, „here“ und „hear“ zuzuordnen – Sie müssen also die Elemente aufschlüsseln und sie einer phonetischen Entsprechung zuordnen (h-„ere“ und h-„ere“ für beide). Und einige Schreibweisen haben unterschiedliche Phonetiken (cough, plough, through) oder haben sogar noch schlimmere Homonymen (the there, they're, their group) und diese können regional unterschiedlich sein (im Vereinigten Königreich beispielsweise das lange oder kurze „a“ in garage, graph und glass). Wenn Sie phonetische Entsprechungen erstellen, sind diese nicht immer singulär.

Sobald Sie phonetische Äquivalenzen haben, können Sie verschiedene Heuristiken verwenden, um den Unterschied zwischen ihnen zu minimieren. Bei Gedichten müssen Sie wahrscheinlich die Gewichtung der Endungen übermäßig betonen – Reime hängen größtenteils von Wortendungen ab. Vielleicht möchten Sie auch bei Gedichten alliterative Verläufe – für wohlklingende Alliteration wäre wahrscheinlich eine andere Gewichtung erforderlich.

Ich würde an einem der kostenlosen Online-Universitätskurse zu NLP teilnehmen – derzeit gibt es mehrere. Eine viel bessere Grundlage für moderne Techniken zur Sprachanalyse. :)

Answer

Ich denke, das ist einigermaßen komplex. Es ist ein Zweig der natürlichen Sprachprogrammierung (nicht das andere NLP, Neurolinguistisches Geschwätz). Sie müssen in der Lage sein, „here“ und „hear“ zuzuordnen – Sie müssen also die Elemente aufschlüsseln und sie einer phonetischen Entsprechung zuordnen (h-„ere“ und h-„ere“ für beide). Und einige Schreibweisen haben unterschiedliche Phonetiken (cough, plough, through) oder haben sogar noch schlimmere Homonymen (the there, they're, their group) und diese können regional unterschiedlich sein (im Vereinigten Königreich beispielsweise das lange oder kurze „a“ in garage, graph und glass). Wenn Sie phonetische Entsprechungen erstellen, sind diese nicht immer singulär.

Sobald Sie phonetische Äquivalenzen haben, können Sie verschiedene Heuristiken verwenden, um den Unterschied zwischen ihnen zu minimieren. Bei Gedichten müssen Sie wahrscheinlich die Gewichtung der Endungen übermäßig betonen – Reime hängen größtenteils von Wortendungen ab. Vielleicht möchten Sie auch bei Gedichten alliterative Verläufe – für wohlklingende Alliteration wäre wahrscheinlich eine andere Gewichtung erforderlich.

Ich würde an einem der kostenlosen Online-Universitätskurse zu NLP teilnehmen – derzeit gibt es mehrere. Eine viel bessere Grundlage für moderne Techniken zur Sprachanalyse. :)

Question 2

Sie können einen Zeichenfolgenvergleich zwischen Zeichenfolgen der gleichen Länge durchführen und ein (oder zwei) nicht übereinstimmende Zeichen zulassen.

Wenn ich mir jedoch Ihre Website ansehe, würde ich vorschlagen, die Wörter nach ihrer phonetischen Darstellung zuzuordnen und dann darin zu suchen, wobei die Zeichenfolgen wie Zeichenarrays behandelt werden und der Vergleich von hinten beginnt.

Um dein Beispiel zu überbauen: near -> \'nir\ pear -> \'per\ dear -> \'dir\ rear -> \'rir\ oder \'rer\ here -> \'hir\

(Ich kopiere hier die phonetische Notation aus dem Merriam-Webster-Online-Wörterbuch)

Ich fürchte, die Zuordnung sollte als Nachschlagetabelle erfolgen und kann nicht kompiliert werden, da es im Englischen keine sehr strengen Ausspracheregeln gibt ...

Wenn Sie Ihre Wörter erst einmal zugeordnet haben, können Sie deren letztes Phonem vergleichen: In diesem Fall möchten Sie vielleicht nach Wörtern suchen, die auf „ir\“ enden (was in diesem Fall „pear“ ausschließen würde).

Diese Methode scheint nicht besonders effizient zu sein: Wenn ich etwas Speicherplatz gebrauchen könnte, würde ich die Suchvorgänge zur späteren Verwendung speichern. Wenn also bei einer zweiten Verwendung nach allen Wörtern gesucht wird, die sich auf „near“ reimen, lädt die Anwendung einfach die gespeicherte Suche – da sich Wörterbücher normalerweise nicht zu schnell weiterentwickeln.

Answer