ShareThis
  • Website-Tools
    Werkzeuge

    Teilen Buttons

    Folgen Buttons

    Reaktionsbuttons

    Teilen Buttons für Bilder

    Soziales Futter

    Generator für Datenschutzrichtlinien

    Einwilligungsmanagement-Plattform

    Plugins

    Wordpress

    Shopify

    ReactJS

    Eckig

    Cloudflare

    Ressourcen

    Hilfe

  • Datenlösungen
    Daten Produkte

    Publikumssegmente

    Kuratierte Daten

    Daten Use-Cases

    Targeting & Aktivierung

    Einblicke & Analytik

    Anreicherung & Personalisierung

    Identitätslösungen

    Atlas Global ID

    Lösungen für die Industrie

    CPG-Lösungen

    B2B-Lösungen

    Ressourcen

    Datenschutz und Qualität

    Daten für den guten Zweck

    Daten-Blog

  • Unternehmen

    Über uns

    Karriere

    Technisches

    Neuigkeiten

    Kontaktieren Sie uns

  • Blog

    Neueste

    Sozial

    Marketing

    Website

    Daten

    Trends

    Neuigkeiten

Kontaktieren Sie uns
Website Tools Anmeldung

Neueste

Sozial

Marketing

Website

Daten

Trends

Neuigkeiten

NLP-Verfahren: Verbesserung der Verbrauchererfahrungen mit Named Entity Recognition (NER)

Zuletzt aktualisiert am 17. Mai 2023
|
Daten

Es ist ein ziemliches Rätsel. Im heutigen digitalen Zeitalter sind Daten der Motor der Geschäftswelt. Das bedeutet, dass Unternehmen Daten benötigen - viele, viele Daten. Aber Daten in ihrem Rohzustand sind praktisch nutzlos. Um die gesammelten Daten in vollem Umfang nutzen zu können, benötigen Sie eine Toolbox mit Techniken zur Verarbeitung natürlicher Sprache (NLP) um Sie dabei zu unterstützen, die Leistungsfähigkeit des maschinellen Lernens zu nutzen und die vielfältigen Erkenntnisse zu gewinnen, die sich in Ihren Daten verbergen.

Zu den nützlichsten dieser NLP-Tools gehört die Technik der Named Entity Recognition (NER). Im Gegensatz zu einfacheren NLP-Techniken handelt es sich bei NER um ein überwachtes Lernmodell: Bevor Sie ein NER-Modell verwenden können, müssen Sie es zunächst mit einem Datensatz von vordefinierten Entitätskategorien trainieren. Dieses hochgradig anpassbare Training macht die Stärke von NER aus, da Sie die Informationen, die Sie extrahieren möchten, im Voraus festlegen.

Was ist Named Entity Recognition (NER)?

NER, auch bekannt als Entity Chunking oder Entity Extraction, ist eine NLP-Technik, die Textdaten scannt, um vordefinierte benannte Entitäten zu identifizieren und zu kategorisieren. Der Prozess extrahiert strukturierte Daten - die Entitäten - aus Rohdaten. Diese strukturierten Daten können dann analysiert werden, um Erkenntnisse zu gewinnen und in zahlreichen Geschäftsfällen eingesetzt zu werden.

Was sind benannte Entitäten?

Benannte Entitäten sind die grundlegenden Informationen, die in jeder Aussage oder jedem Satz enthalten sind, z. B.:

  • Namen
    • Menschen
    • Organisationen
    • Orte
    • Produkte
  • Zeitliche Einheiten
    • Datum
    • Zeiten
  • Zahlen
    • Messungen 
    • Entfernungen
    • Geld / Preisgestaltung
    • Mengen

Benannte Entitäten sind der Schlüssel zur Flexibilität eines NER-Modells: Da sie beliebig sein können, haben Sie die Möglichkeit, Ihr Modell so zu trainieren, dass es genau die Informationen extrahiert, die Sie für Ihren speziellen Anwendungsfall benötigen. 

Wie funktioniert die NER?

Bedenken Sie, was beim Lesen passiert: Während Ihre Augen die Wörter abtasten, identifizieren Sie automatisch alle genannten Personen. Wenn Sie zum Beispiel den Satz "Am 27. Oktober 2022 verließ Wendy Neverland, um ihre neue Stelle als CEO von Lost Boys Inc. anzutreten.", haben Sie wahrscheinlich die folgenden Personen erkannt:

  • Datum: Juni 27, 2022
  • Person: Wendy
  • Standort: Nimmerland
  • Berufliche Tätigkeit: CEO
  • Organisation: Lost Boys Inc.

Maschinen hingegen verwenden eine binäre Sprache (0, 1). Und 0s und 1s sind weit entfernt von der Reichhaltigkeit und Tiefe der menschlichen Sprache. Da sich Maschinensprache und menschliche Sprache erheblich unterscheiden, muss das NER-Modell zunächst mit Hilfe des maschinellen Lernens trainiert werden. Dazu werden vordefinierte Datensätze verwendet, die die von Ihnen gewählten Kategorien benannter Entitäten enthalten. Im obigen Szenario wurden zum Beispiel die Entitätskategorien Datum, Person, Ort, Beruf und Organisation vordefiniert.

Wie funktioniert also NER? Sobald sie trainiert sind, verwenden NER-Modelle einen zweistufigen Prozess, um die Art und Weise, wie Menschen lesen, zu imitieren. Zunächst identifiziert das Modell eine benannte Entität, und dann klassifiziert oder kategorisiert es diese Entität.

Einige NER-Systeme verwenden Wortvektoren, um Geschwindigkeit und Genauigkeit zu verbessern. Wortvektoren stellen Wörter als Zahlen dar, aber anstatt einfach jedem Wort eine Zahl zuzuordnen, erzeugen Wortvektoren numerische Darstellungen im Dezimalformat über eine Reihe von Dimensionen, wie z. B. die Häufigkeit des Auftretens in einer Vielzahl von Kontexten. Das Ergebnis? Ähnliche Wörter haben Zahlen, die eng miteinander verbunden sind, so dass das NER-Modell ähnliche Wörter schnell und genau finden kann. 

Hier ist ein extrem vereinfachtes Beispiel. Nehmen wir an, Sie arbeiten mit einem Datensatz, der aus Bewertungen Ihres Möbelgeschäfts besteht. Wenn Sie nur über eine Dimension arbeiten, ist der Wortvektor, den Ihr trainiertes Modell für "Lampe" erzeugt, 0,223458993. Wortvektoren können Ihnen helfen, Wörter zu finden, die dem Wort "Lampe" ähnlich sind:

hell: 0,212835892

Leuchte: 0.212444586

Kronleuchter: 0.199875213

Das Problem der Mehrdeutigkeit lösen

Ein Teil der Komplexität der menschlichen Sprache liegt in der Anzahl der Wörter, die mehrere Bedeutungen haben. Diese auch als Homonyme bezeichneten Wörter sind für den Menschen in der Regel nicht mehrdeutig, solange ein ausreichender Kontext vorhanden ist, um die richtige Bedeutung zu entschlüsseln. 

Zum Beispiel wissen wir aufgrund des Kontextes, was in jedem der folgenden Sätze gemeint ist:

Der Pitcher hat drei Strikes hintereinander geworfen.

Sie baten um einen weiteren Krug mit Eiswasser.

Maschinen sind jedoch nicht in der Lage, den Kontext zu verstehen, so dass die mehrdeutige Sprache in diesem Beispiel eine echte Herausforderung darstellt. Da es sich bei NER-Modellen jedoch um überwachte Lernmodelle handelt, d. h. sie müssen zunächst trainiert werden, bevor sie angewendet werden können, wurden Ansätze für maschinelles Lernen entwickelt, die ihnen helfen, diese Herausforderung zu meistern. 

Beliebte NER-Anwendungsfälle

Sie könnten NER einfach dazu verwenden, mehr strukturierte Daten zu sammeln und in einer Datenbank zu speichern. Aber die Fähigkeit von NER, strukturierte Daten aus Rohdaten zu extrahieren, macht es für eine große Anzahl von Anwendungsfällen nützlich, darunter:

Suchfunktion im elektronischen Handel. Eine genaue Suchfunktion kann für den Verkauf im elektronischen Handel entscheidend sein. Ein Kunde, der zum Beispiel nach einem "weißen, runden Cocktailtisch" sucht, sucht nicht nach weißen Produkten, runden Produkten, Cocktailprodukten oder irgendeiner Art von Tisch. Eine NER-gestützte Suchfunktion würde die richtigen Ergebnisse liefern, indem sie "weiß" als [Produktfarbe], "rund" als [Produktform] und "Cocktailtisch" als [Produkttyp] kategorisiert.

Kundenbetreuung. Mehrere Abteilungen, Produkte und Niederlassungen können Ihr Kundensupport-Team vor eine große Herausforderung stellen. Bevor Beschwerden jedoch bearbeitet werden können, müssen Kunden-E-Mails und Tickets sortiert werden, um festzustellen, welche Standorte, Produkte und Abteilungen betroffen sind. NER kann den Arbeitsablauf Ihres Teams effizienter gestalten, indem es Entitäten wie [Standort] und [Produkt] kategorisiert und die sortierten Beschwerden und Anfragen automatisch an das richtige Teammitglied weiterleitet. 

Verfolgen Sie wiederkehrende Probleme. Heutzutage ist es genauso wahrscheinlich, dass Kunden sich in den sozialen Medien beschweren, wie sie es per E-Mail oder telefonisch tun. Unternehmen, die sich dieses Trends bewusst sind, richten oft einen separaten Social-Media-Handle speziell für die Bearbeitung solcher Beschwerden ein. Ein NER-Modell kann dann in diesem beschwerdeorientierten Social-Media-Feed verwendet werden, um Tweets oder Posts in Daten zu sortieren, die verwendet werden können, um Produkte, Standorte oder sogar wichtige Tageszeiten zu erkennen, die zu wiederkehrenden Beschwerden führen. 

Chatbots zur Unterstützung. Chatbots bieten Unternehmen die Möglichkeit, schnelle Lösungen für allgemeine Probleme anzubieten. Sie können NER verwenden, um Ihren Support-Bot zu trainieren, damit er eine Reihe typischer Support-Probleme effizient lösen kann, indem Sie einen Trainingsdatensatz verwenden, der Entitäten enthält, die für diese Probleme im Chat-Kontext relevant sind. Auf der Grundlage der Identifizierung und Klassifizierung dieser Entitäten - z. B. Produktseriennummern oder Gutscheincodes - kann der Bot entweder eine relevante Antwort liefern oder den Chat zur Eskalation kennzeichnen. 

Targeting/Zielgruppensegmentierung. ShareThis wendet NER an, um seine Daten zu filtern, indem es Entitäten aus Webseiten extrahiert, die seinen Javascript-Code tragen, wodurch Sie Ihr perfektes Zielpublikum erreichen können. So kann NER beispielsweise durch die Unterscheidung von Apple (dem Unternehmen) und Apfel (der Frucht) das Zielgruppensegment identifizieren, das sich für Apple-Produkte interessiert. 

Fazit

Die von Ihnen gesammelten Rohdaten können nicht ohne Weiteres verwendet werden. Reichern Sie Ihre Daten mit Daten von einem Anbieter wie ShareThis an und wenden Sie dann NER-Modelle an, um wichtige Entitäten zu identifizieren, zu extrahieren und zu klassifizieren. Mithilfe von NER können Sie Ihre angereicherten Daten in eine unschätzbare Quelle von Erkenntnissen umwandeln, die in einer Vielzahl von Anwendungsfällen eingesetzt werden können und es Ihnen ermöglichen, die Arbeitsabläufe Ihrer Teams besser zu unterstützen. 

Entdecken Sie ShareThis Datenlösungen
Über ShareThis

ShareThis erschließt seit 2007 die Macht des globalen digitalen Verhaltens durch die Synthese von Social Share-, Interessen- und Absichtsdaten. Auf der Grundlage des Verbraucherverhaltens auf mehr als drei Millionen globalen Domains beobachtet ShareThis Echtzeit-Aktionen von echten Menschen auf echten digitalen Zielen.

Abonnieren Sie unseren Newsletter

Erhalten Sie die neuesten Nachrichten, Tipps und Updates

Abonnieren

Verwandte Inhalte

  • Die sich schnell verändernde Zukunft des Datenschutzes und wie man sich darauf vorbereitet
    Daten
    Die sich schnell verändernde Zukunft des Datenschutzes und wie man sich darauf vorbereitet
    Wenn Ihnen der derzeitige Stand des Datenschutzes wie ein Wrack vorkommt,...
    <small class="time-icon">12m read</small>
  • Menschenbasiertes Marketing: 5 Schritte für den Einstieg
    Daten
    Menschenbasiertes Marketing: 5 Schritte für den Einstieg
    Wenn es gut ausgeführt wird, ermöglicht personenbasiertes Marketing den Marken, die richtigen Personen mit den richtigen Inhalten zu erreichen...
    <small class="time-icon">7m read</small>
  • Blick unter die Haube des Lookalike Modeling
    Daten
    Blick unter die Haube des Lookalike Modeling
    Auf dem schnelllebigen digitalen Markt von heute ist es von höchster Priorität, der Konkurrenz voraus zu sein. Das bedeutet, dass...
    <small class="time-icon">7m read</small>
  • Die Ära der Datenschutzgesetze: Ein umfassender Leitfaden
    Daten
    Die Ära der Datenschutzgesetze: Ein umfassender Leitfaden
    Gartner schätzt, dass bis zum Ende dieses Jahres 65 % der Menschen weltweit...
    <small class="time-icon">15m read</small>
  • Website-Tools

    • Teilen Buttons
    • Buttons für soziale Medien
    • Facebook Teilen Button
    • Whatsapp Teilen Button
    • Pinterest Teilen Button
    • Folgen Buttons
    • Instagram Folgen Button
    • Facebook Folgen Button
    • LinkedIn Folgen Button
    • Soziale Plugins
    • Hilfe
  • ShareThis Daten

    • Datenlösungen
    • Targeting & Aktivierung
    • Einblicke & Analytik
    • Anreicherung & Personalisierung
    • Publikumssegmente
    • Kuratierte Daten
    • B2B-Lösungen
    • CPG-Lösungen
    • Datenschutz und Datenqualität
    • Atlas Global ID
    • Globale Verbrauchertrends
  • Unternehmen

    • Über uns
    • Karriere
    • Technisches
    • Neuigkeiten
    • Kontaktieren Sie uns
  • Datenschutz

    • Datenschutz
    • AdChoices / Do Not Sell/Share My Data
    • Klicken Sie hier, um sich von den ShareThis Diensten abzumelden.
    • Nutzungsbedingungen für Herausgeber
  • In Kontakt bleiben

    Erhalten Sie die neuesten Nachrichten, Tipps und Updates
  • Abonnieren

  • © 2025 ShareThis. All Rights Reserved.

    • EN
    • ES
    • FR
    • IT
    • TW
    • PT
    • JA