Zadanie z biblioteką NLTK - statystyczne przetwarzanie zdań języka
naturalnego
-
Zapoznaj się z biblioteką NLTK, np. przeczytaj to
wprowadzenie.
-
Przeczytaj pierwszy rozdział książki
Bird, Klein, Loper i spróbuj przerobić przykłady z podrozdziałów
1.1, 1.2, i 1.3 (dalsze podrozdziały możesz pominąć).
Zwróć uwagę na operacje oznaczania części mowy (part of speech tagging)
i segmentacji na części zdania (part of sentence chunking).
Następnie wykonaj polecenia i odpowiedz na pytania 4-14 w sekcji 1.8
UWAGA:
Zamiast instalować Pythona, NLTK i inne potrzebne biblioteki na
własnym komputerze, możesz wykorzystać gotową instalację na
komputerach w laboratorium. Biblioteka NLTK wraz z wszystkimi
korpusami jest zainstalowana na panamincie, jak również na serwerze
lab103, oraz stacjach roboczych w 127/P (system Linux). W systemie
zainstalowana jest biblioteka NLTK wraz z wszystkimi korpusami.
Przykłady z książek "Natural Language Processing with Python" i
"Python Text Processing with NLTK 2.0 Cookbook" działają na tych
komputerach bez żadnych dodatkowych ustawień. Należy wywołać w
terminalu tekstowym pythona, i zacząć pracę (lub umieścić w nagłówku
każdego skryptu pythonowego): "import nltk".
-
Przeczytaj drugi rozdział książki
Bird, Klein, Loper (podrozdział 2.3 chyba możesz bezpiecznie pominąć).
Zwróć uwagę na format i treść poszczególnych omawianych tam korpusów.
Następnie wykonaj polecenia i odpowiedz na pytania 1-4 w sekcji 2.8
-
Alternatywnym do powyższych dwóch punktów ćwiczeniem może być wykonanie
ćwiczeń podanych w rozdziałach 1 i 4 (oraz najlepiej 2-3 kolejnych rozdziałów) książki
NLTK Cookbook.
Ćwiczenia w tej książce są podane w bardziej przystępny sposób.
Niestety, nie znalazłem wersji tej książki dostępnej w całości do
bezpłatnego ściągnięcia w Internecie.
Aktualizacja: Wednesday, 18-Jan-2012 21:34:26 CET