Einführung in die Named Entity Recognition
Termin: 27.11.2023 (Montag), von 14.00 Uhr bis 16.00 Uhr
Ort: Seminarraum 7, Jakobi-Passage, Kröpeliner Str. 57
Die Teilnahme am Workshop ist kostenlos. Es wird um Anmeldung unter dh.wkt@uni-rostock.de bis zum 23. November gebeten.
Der Workshop führt in die Named Entity Recognition (NER) mit dem Stanford Named Entity Recognizer am Beispiel von literarischen Texten ein. Bei NER handelt es sich um ein Machine-Learning-Verfahren aus dem Bereich der Computerlinguistik, bei dem in der Regel Orte, Personen und Organisationen in Texten automatisch erkannt und klassifiziert werden. Um NER auf einen nicht-linguistischen geisteswissenschaftlichen Gegenstand anzuwenden, muss die Methode meist sowohl konzeptuell als auch gegenstandsorientiert angepasst werden (die sogenannte Domänenadaption). In diesem Workshop wird die linguistische NER anhand von Texten aus einem anderen Gegenstandsbereich gezeigt und erprobt. Anschließend wird beispielhaft eine Domänenadaption durchgeführt. Der Workshop umfasst folgende Arbeitskomeponenten der Named Entity Recognition:
- Anwendung des Tools StanfordNER
Erstellung eines Trainingskorpus aus einer anderen geisteswissenschaftlichen Domäne
Training eines eigenen Classifiers für den StanfordNER
Anwendung des eigenen Classifiers und Vergleich mit der linguistischen NER
Der Workshop richtet sich an Einsteiger*innen ohne Vorkenntnisse. Während des Workshops kann an eigenen Textdaten gearbeitet werden. Es werden aber auch Beispieldaten aus der Domäne der Literaturwissenschaft zur Verfügung gestellt.