Um für die Abfragebegriffe ähnliche Begriffe zu ermitteln, müssen die phonetischen Kodes der Abfragebegriffe mit den phonetischen Kodes der Begriffe in der Sammlung verglichen werden.
Problematisch wird dies bei größeren Datenmengen, wenn die Aufbereitung interaktiv erfolgt, d.h. wenn z.B. erst bei der Abfrage die Kodes der Begriffe in der Sammlung berechnet werden.
Die phonetischen Kodes in der Sammlung sollten daher vorher berechnet worden sein, zumal sie sich ohne Veränderung des Verfahrens nicht wieder ändern.
Eine Sammlung dieser Art wird hier als phonetisches Lexikon bezeichnet. Zur Veranschaulichung kann ein Auszug folgendermaßen dargestellt werden:
H616:hervorgegangen H616:hervorgehen H616:hervorgehoben H616:hervorgeht H616:hervorgerufen H616:hervorgerufene H616:hervorgerufenen H616:hervorheben H616:hervorhebender H616:hervorlugen H616:hervorlugten H616:hervorragen H616:hervorragend H616:hervorragendem H616:hervorschaut H616:hervorzuheben H616:hierfür H616:hierüber H616:höherfrequente H616:hörbar H616:hörbaren H620:Harsch H620:Harz H620:Heraus H620:Hersee H620:Herz
Als phonetische Kodes wurden in diesem Beispiel Soundex-Kodes verwendet. Diese Kodes wurden früher insbesondere für Namen verwendet, sind aber wegen ihrer unkomplizierten Berechnung als Beispiel hier gut geeignet.