Plik danych zawierający opis instancji świata i parametrów eksperymentu jest
plikiem tekstowym składającym się z szeregu wierszy. Każdy wiersz zawiera na
początku etykietę (napis tekstowy), i po niej jeden do trzech parametrów
liczbowych. Dopuszczalne są następujące etykiety:
- W (obowiązkowy) określa rozmiar świata: poziomy i pionowy (2xINT),
- S (opcjonalny) określa współrzędne stanu startowego (2xINT),
- P (obowiązkowy) określa rozkład prawdopodobieństwa p1 p2 p3 zadania (3xFLOAT),
- R (obowiązkowy) określa parametr r zadania (1xFLOAT),
- G (obowiązkowy) określa parametr γ zadania (1xFLOAT),
- E (opcjonalny) określa parametr ε zadania (1xFLOAT),
- T (wielokrotny - musi wystąpić 1 lub więcej razy) definiuje pojedynczy
stan terminalny: dwie współrzędne i indywidualną wartość nagrody (2xINT+1xFLOAT),
- B (wielokrotny - może wystąpić 0 lub więcej razy) definiuje pojedynczy
stan specjalny: dwie współrzędne i indywidualną wartość nagrody (2xINT+1xFLOAT),
- F (wielokrotny - może wystąpić 0 lub więcej razy) definiuje pojedynczy
stan zabroniony: dwie współrzędne (2xINT).
Współrzędne stanów liczone są od 1 i początkiem układu współrzędnych jest
lewy dolny narożnik wyświetlanej reprezentacji świata.
Dopuszczalna jest dowolna kolejność wierszy pliku, pod warunkiem wystąpienia
dokładnie po jednym z wierszy obowiązkowych, i co najwyżej po jednym z wierszy
opcjonalnych. Musi również wystąpić co najmniej jeden stan terminalny.
Ponadto parametry świata MDP muszą spełniać następujące warunki:
p1, p2, p3 >= 0.0 <= 1.0
p1+p2+p3 <= 1.0
gamma > 0.0 <= 1.0
wszystkie jawnie zdefiniowane stany (S, T, B, F) muszą leżeć w określonych rozmiarach świata
Przykładowa treść pliku danych opisująca instancję problemu MDP z wykładu
(i podręcznika Russella i Norviga):
W 4 3
S 1 1
P .8 .1 .1
R -0.04
G 1.00
T 4 3 1.
T 4 2 -1.
F 2 2