pumpa

Pumpálási lemma reguláris nyelvekre

Állítás (Ez a lemma állítása)
Ha

reguláris nyelv, akkor $\exists n\geq 0$ egész szám, hogy $\forall w\in L$ , ahol $\vert w\vert\geq n$ és w minden

részszavára, ahol

és $\vert w_1\vert\geq n$ , létezik

-nek egy

felosztása, amelyben $y\not = \epsilon$ és amely felbontásra $uxy^izv \in L$ minden $i\geq 0$ esetén.

Azaz: Ha

egy reguláris nyelv, akkor létezik egy olyan hossz, aminél hosszabb tetszõleges

-beli szóban tetszõlegesen kiválasztva egy ennél a hossznál nagyobb részszót igaz lesz a következõ: ezen részszóban van egy olyan rész valahol, melyet tetszõlegesen sokszor megismételve (vagy elhagyva) még mindig

-beli szavakat kapunk.

Ennek a haszna:
Segítségével be lehet látni nyelvekrõl, hogy nem regulárisak. Ez úgy megy, hogy ha megmutatjuk egy nyelvrõl, hogy van olyan szava, amiben nem lehet a fentiek szerint pumpálni, akkor az tuti nem reguláris.
Vigyázat! Lehetnek olyan nyelvek, amiket lehet pumpálni, de mégsem regulárisak. Vagyis ez a lemma csak a nem-reguláris nyelvek egy részét buktatja le.

Például az $\{a^kb^k\;\vert\; k\geq 1\}$ nyelv nem reguláris, mert:
Tegyük fel, hogy az. Vegyük az

szót, ahol az

az az

, aminek létezését a lemma garantálja és jelöljük ki

-nek az

részszót! Ha ebben pumpálunk, akkor az

-k száma megnõ, de közben a

-k száma nem változik, azaz a kapott szó nem lesz eleme a nyelvnek.
Ezzel beláttuk, hogy a nyelv nem reguláris.

A lemma bizonyítása:
Ha az

nyelv reguláris, akkor van egy olyan véges automata, ami elfogadja õt. Legyen $n:=\vert Q\vert$ , azaz

legyen az automata állapotainak a száma. Nézzük, hogy az automata milyen állapotokat érint, onnantól kezdve, hogy rálép a $w_1=x_1\cdots x_t$ ( $t\geq n$ ) szó elsõ betûjére, egészen odáig, hogy lelép az utolsóról is. Ez összesen

állapot: $q_{i_1}, \cdots ,q_{i_{t+1}}$ . Mivel ez több, mint amennyi állapota az automatának van, biztosan van közöttük két egyforma. Ha $q_{i_k}=q_{i_l}=q$ , akkor ez éppen azt jelenti, hogy a szó olvasása során az automata az $y=x_{i_k}\cdots x_{i_{l-1}}$ részszó olvasását a

állapotban kezdi el, elolvassa részszót és ekkor is

-ban van. Ha ekkor megint az

részszó jönne (akárhányszor), akkor megint csak

-ba kerülne. Mivel az eredeti teljes

szó elolvasása után elfogadóban áll meg az automata (azaz a

-ból tovább olvasva a maradék szót elfogadóba jutunk), a sok

-t tartalmazó futásokkor is lesz vele, azaz ezeket a szavakat is elfogadja.
Az

eset úgy jön ki, hogy ha kihagyjuk az eredeti szóból az

-t, a maradék szót akkor is a

állapotból kezdjük el elolvasni, úgy meg elfogadunk.