Zadanie z biblioteką NLTK - statystyczne przetwarzanie zdań języka naturalnego

Zapoznaj się z biblioteką NLTK, np. przeczytaj to wprowadzenie.
Przeczytaj pierwszy rozdział książki Bird, Klein, Loper i spróbuj przerobić przykłady z podrozdziałów 1.1, 1.2, i 1.3 (dalsze podrozdziały możesz pominąć).
Zwróć uwagę na operacje oznaczania części mowy (part of speech tagging) i segmentacji na części zdania (part of sentence chunking).
Następnie wykonaj polecenia i odpowiedz na pytania 4-14 w sekcji 1.8
UWAGA:
Zamiast instalować Pythona, NLTK i inne potrzebne biblioteki na własnym komputerze, możesz wykorzystać gotową instalację na komputerach w laboratorium. Biblioteka NLTK wraz z wszystkimi korpusami jest zainstalowana na panamincie, jak również na serwerze lab103, oraz stacjach roboczych w 127/P (system Linux). W systemie zainstalowana jest biblioteka NLTK wraz z wszystkimi korpusami. Przykłady z książek "Natural Language Processing with Python" i "Python Text Processing with NLTK 2.0 Cookbook" działają na tych komputerach bez żadnych dodatkowych ustawień. Należy wywołać w terminalu tekstowym pythona, i zacząć pracę (lub umieścić w nagłówku każdego skryptu pythonowego): "import nltk".
Przeczytaj drugi rozdział książki Bird, Klein, Loper (podrozdział 2.3 chyba możesz bezpiecznie pominąć).

Zwróć uwagę na format i treść poszczególnych omawianych tam korpusów.
Następnie wykonaj polecenia i odpowiedz na pytania 1-4 w sekcji 2.8
Alternatywnym do powyższych dwóch punktów ćwiczeniem może być wykonanie ćwiczeń podanych w rozdziałach 1 i 4 (oraz najlepiej 2-3 kolejnych rozdziałów) książki NLTK Cookbook.
Ćwiczenia w tej książce są podane w bardziej przystępny sposób. Niestety, nie znalazłem wersji tej książki dostępnej w całości do bezpłatnego ściągnięcia w Internecie.

Aktualizacja: Wednesday, 18-Jan-2012 21:34:26 CET