Matijasevičova věta studijní materiál, draft verse k připomínkování, 16. 11. 2007 Michal Černý, katedra ekonometrie, VŠE Praha Cílem tohoto materiálu je podat důkaz důležitého tvrzení, známého jako Matijasevičova věta. Jeho moderní historie se odvíjí od roku 1900, kdy David Hilbert položil otázku, zdali existuje obecná metoda řešení diofantických rovnic (tzv. desátý Hilbertův problém). Diofantické rovnice jsou rovnice tvaru P (x 1, x 2,..., x n ) = 0, kde P (x 1, x 2,..., x n ) je polynom s celočíselnými koeficienty, a řešení hledáme buď v oboru přirozených nebo v oboru celých čísel. Známé příklady takových rovnic jsou: a 2 + b 2 c 2 = 0; jistě nikoho nepřekvapí, že tato diofantická rovnice má řešení třeba 3, 4, 5. Co třeba rovnice a 3 + b 3 + c 3 = 29? Tato má samořejmě řešení a = 3, b = 1, c = 1. Rovnice a 3 + b 3 + c 3 = 30 má taktéž řešení, je jím a = 283 059 965, b = 2 218 888 517, c = 2 220 422 932. (Řešení pochází z roku 1999.) Pro rovnici je existence řešení otevřený problém. a 3 + b 3 + c 3 = 33 Problém je to těžký, protože přirozená a celá čísla jsou diskrétní. Takové problémy by nevzikaly, kdybychom hledali řešení v oboru reálných či komplexních čísel. V IR a v C jsou polynomy spojité funkce, díky čemuž lze o existenci řešení rovnic v IR a v C rozhodovat algoritmicky (jde ovšem o silně netriviální výsledek, viz větu 50). Hilbert položil důraz na otázku, zdali existuje metoda, jak hledat řešení diofantických rovnic. Taková metoda musí mít dva kroky: (i) rozhodnout, zdali vůbec nějaké řešení existuje a (ii) najít jej. Je zřejmé, že z algoritmického 1
hlediska je podstatný krok (i) jakmile dokážeme zjistit, že daná rovnice P (x 1, x 2,..., x n ) = 0 má řešení, pak jej stačí hledat hrubou silou, tzn. postupně enumerovat všechny n-tice čísel (x 1, x 2,..., x n ) a dosazovat je do P. Pak je jen otázkou času, kdy náš postup skončí a nalezne řešení, protože z kroku (i) máme zaručeno, že toto existuje. Matijasevičova věta dává na Hilbertovu otázku zápornou odpověď: neexistuje algoritmus, který by dostal na vstup polynom P a v konečném čase rozhodl, zdali rovnice P = 0 má nebo nemá řešení v oboru přirozených nebo celých čísel. Proto se někdy o Matijasevičově větě hovoří jako o záporném řešení desátého Hilbertova problému. Následující věta ukazuje, že není podstatné, klademe-li otázky po řešitelnosti rovnic v oboru přirozených a v oboru celých čísel. Věta 1. Existuje algoritmus rozhodující řešitelnost rovnic P = 0 (P je polynom s celočíselnými koeficienty) v oboru přirozených čísel, právě když existuje algoritmus rozhodující řešitelnost rovnic P = 0 v oboru celých čísel. Důkaz. Mějme algoritmus, který rozhoduje o existenci řešení rovnice P (x 1, x 2,..., x n ) = 0 v oboru přirozených čísel. Můžeme jej snadno využít k řešení v oboru celých čísel, předhodíme-li mu rovnici (s 1,s 2,...,s n) { 1,1} n P (s 1 x 1, s 2 x 2,..., s n x n ) = 0. Tato rovnice má evidentně řešení, jestliže alespoň pro jednu volbu znamének s 1, s 2,..., s n je P (s 1 x 1, s 2 x 2,..., s n x n ) = 0. Tak získáme odpověď na existenci řešení v oboru celých čísel. Na druhou stranu, nechť máme algoritmus, který rozhoduje o řešitelnosti v oboru celých čísel, a chceme rozhodnout, zdali existuje řešení rovnice P (x 1, x 2,..., x n ) = 0 v oboru přirozených čísel. Lze dokázat (to je známá věta z teorie čísel), že každé přirozené číslo lze psát jako součet čtyř druhých mocnin přirozených čísel: x i = a 2 i + b 2 i + c 2 i + d 2 i. (1) Takže našemu algoritmu stačí předhodit k rozhodutí o existenci řešení rovnici P (a 2 1 + b 2 1 + c 2 1 + d 2 1,..., a 2 n + b 2 n + c 2 n + d 2 n) = 0 se 4n neznámými. Pokud algoritmus odpoví, že tato rovnice má celočíselné řešení, pak máme i pomocí (1) i přirozené řešení. 2
Důsledek 2. Ke každé diofantické rovnici P (x 1, x 2,..., x n ) = 0 existuje diofantická rovnice Q(x 1, x 2,..., x n ) = 0 taková, že P = 0 má řešení v celých číslech, právě když Q = 0 má řešení přirozených číslech. Je tedy zřejmé, že rozhodnout, zdali daná diofantická rovnice má řešení v celých číslech a v přirozených číslech jsou dva stejně obtížné problémy (alespoň v tom smyslu, že algoritmicky je řešitelný první, právě když je algoritmicky řešitelný druhý). Patrně nejznámějších verse formulace Matijasevičovy věty zní, že ani jeden z těchto dvou problémů není řešitelný. Věta 3 (Matijasevič (Robinsonová, Davis, Putnam)).. Neexistuje algoritmus (řekněme Turingův stroj), který (v konečném čase) rozhodne, zda daná diofantická rovnice má řešení v oboru přirozených (nebo celých) čísel. Při hledání řešení diofantických rovnic by člověk mohl očekávat jistou naději. I kdyby třeba nehledal přímo nějaký vzoreček, jako máme třeba vzoreček pro řešení kvadratických rovnic v komplexníxh číslech, mohl by hledat alespoň jistý horní odhad na řešení. Mohl by doufat, že se mu podaří dokázat větu typu jestliže je daný polynom P stupně n s koeficienty a 1, a 2,..., a m, pak existuje-li řešení x rovnice P = 0, pak x f(n, a 1, a 2,..., a m ), kde f je nějaká rozumná funkce. Matijasevičova věta říká, že každá taková funkce je f nerekursivní. Lze ji tedy zformulovat i slovy, že neexistuje rekursivní horní odhad na velikost řešení diofantických rovnic. (Samozřejmě: kdyby takový rekursivní horní odhad existoval, stačilo by prozkoumat f(n, a 1, a 2,..., a m ) čísel, a kdybychom řešení rovnice P = 0 nenalezli, prohlásili bychom, že rovnice nemá řešení to by byla rekursivní procedura řešící diofantické rovnice, a tato neexistuje.) Není marné si rozmyslet, že pro některé typy polynomů rekursivní horní odhad existuje; například, je-li P součtem druhých mocnin polynomů prvního stupně. Dokážeme Matijasevičovu větu v obecnější versi; ukážeme, že diofantické rovnice představují další formalisaci pojmu algoritmus, podobně jsme formalisovali algoritmy pomocí Turingových strojů a částečné rekursivních funkcí. Nejprve je však třeba říci, co míníme diofantickou representací funkcí a množin. Definice 4. (a) Řekneme, že množina (relace, predikát) A IN n má diofaktickou representaci P (x 1, x 2,..., x n, y 1, y 2,..., y m ), 3
jestliže P (x 1, x 2,..., x n, y 1, y 2,..., y m ) je polynom s celočíselnými koeficienty a platí, že rovnice P (x 1, x 2,..., x n, y 1, y 2,..., y m ) = 0 má řešení v oboru přirozených čísel, právě když (x 1, x 2,..., x n ) A. Jinými slovy, (x 1, x 2,..., x n ) A právě když existují přirozená čísla y 1, y 2,..., y n taková, že P (x 1, x 2,..., x n, y 1, y 2,..., y m ) = 0. (b) Řekneme, že funkce f : IN n IN má diofaktickou representaci P (z, x 1, x 2,..., x n, y 1, y 2,..., y m ), jestliže P (z, x 1, x 2,..., x n, y 1, y 2,..., y m ) je polynom s celočíselnými koeficienty a platí, že rovnice P (z, x 1, x 2,..., x n, y 1, y 2,..., y m ) = 0 má řešení v oboru přirozených čísel, právě když z = f(x 1, x 2,..., x n ). Jinými slovy, z = f(x 1, x 2,..., x n ) právě když existují přirozená čísla y 1, y 2,..., y n taková, že P (z, x 1, x 2,..., x n, y 1, y 2,..., y m ) = 0. Funkce, resp. množina je diofantická, má-li diofantickou representaci. Tato definice dovoluje výpočet (některých) funkcí a charakteristických funkcí (některých) predikátů vyjádřit pomocí diofantických rovnic. Vyvineme nemalé úsilí, abychom dokázali následující silné tvrzení: Věta 5. Funkce f : IN n IN je částečně rekursivní, právě když je diofantická. Predikát (množina přirozených čísel) A(x 1, x 2,..., x n ) je rekursivně spočetný, právě když je diofantický. Konvence. V definici 4 jsme uvedli, že množina má diofantickou representaci, jestliže existuje polynom P s celočíselnými koeficienty tak, že rovnice P = 0 má řešení. Naším cílem bude, mimo jiné, pracovat s polynomy jako s 4
objekty aritmetiky, a tato (obvykle) pracuje s přirozenými čísly. Není však žádný problém v rovnici P = 0 přeházet členy se zápornými znaménky na pravou stranu, takže dostaneme rovnost dvou polynomů s přirozenými koeficienty. Jsme-li ve světě přirozených čísel, měli bychom definovat diofantičnost množin tak, že existují dva polynomy Q, R s přirozenými koeficienty tak, že rovnice Q(x 1, x 2,..., x n, y 1, y 2,..., y n ) = R(x 1, x 2,..., x n, y 1, y 2,..., y n ) (2) má řešení v přirozených číslech. (Analogicky i pro diofantičnost funkcí.) V důkazu Matijasevičovy věty budeme pracovat s versí P = 0 a nikoliv s Q = R ; není to újmě na obecnosti. Mohli bychom ekvivalentně vyslovit Matijasevičovu větu ve versi, že množina A je rekursivně spočetná, právě když existuje dvojice polynomů Q, R s přirozenými koeficienty taková, že (x 1,..., x n ) A, právě když existují přirozená y 1, y 2,..., y n splňující rovnost (2). Důkaz triviální implikace věty 5. Snadno se nahlédne, že funkce f, jež je diofantická, je částečně rekursivní; její graf je totiž rekursivně spočetný. Chceme-li enumerovat její graf stačí vzít polynom {(x 1, x 2,..., x n, z) : z = f(x 1, x 2,..., x n )}, P (z, x 1, x 2,..., x n, y 1, y 2,..., y m ), který je její diofantickou representací, a postupně enumerovat všechny (n + m + 1)-tice přirozených čísel (z, x 1,..., x n, y 1,..., y m ) a dosazovat je do polynomu P (z, x 1, x 2,..., x n, y 1, y 2,..., y m ). Jakmile jej vyhodnotíme a obdržíme, že P = 0, nalezli jsme bod na grafu (x 1, x 2,..., x n, z) a zapíšeme jej na výstup. Tím postupně enumerujeme graf funkce f a tato je tudíž částečně rekursivní. Podobě to učiníme s diofantickou množinou A, stejným způsobem dokážeme enumerovat její prvky, takže je rekursivně spočetná. Obtížná je samozřejmě druhá implikace, že každá částečně rekursivní funkce a každá rekursivně spočetná množina (relace, predikát) je diofantická. Důkaz této implikace provedeme tak, že ukážeme, že třída diofantických funkcí obsahuje funkce základní (nulu, následníka, projekci to je však triviální) a 5
je uzavřena na primitivní rekursi a minimalisaci (což není triviální). Z faktu, že třída částečných rekursivních funkcí splývá s třídou funkcí vyčíslitelných Turingovým strojem, dostáváme důsledek, že funkce je Turingovsky vyčíslitelná, právě když je diofantická, a dokonce lze překlad z jedné representace do druhé učinit pomocí algoritmického překladače. Je zřejmé, že až budeme mít dokázánu větu 5, snadno z ní plyne věta 3. Víme totiž, že existují rekursivě spočetné množiny, které nejsou rekursivní, například K = {e : e W e } (halting problem). Podle Matijasevičovy věty existuje polynom P (e, y 1, y 2,..., y n ) takový, že e K právě když pro nějaká y 1, y 2,..., y n je P (e, y 1, y 2,..., y n ) = 0. Kdybychom měli algoritmus, který rozhoduje o řešitelnosti diofantické rovnice vpravo, rozhodoval by tento i o řešení halting problemu, což jak víme není možné. Z důkazu Matijasevičovy věty plyne i následující pozoruhodný výsledek (formulujeme jej jen pro funkce, ale není problém jej reformulovat pro množiny čísel). Důsledek 6. Existuje algoritmus A takový, že je-li dán program (Turingův stroj) T, pak A po konečném počtu kroků na výstup napíše polynom, který je diofantickou representací funkce, již program T počítá. Tvrzení plyne z toho, že celý důkaz Matijasevičovy věty je konstruktivní, a lze jej tudíž naprogramovat. Lze tedy sestavit program, který daný Turingův stroj přepíše na polynom. Mějme dán Turingův stroj: podle věty o simulacích lze algoritmicky sestavit částečně rekursivní funkci, jež počítá funkci vyčíslovanou tímto strojem. Přesněji: získáme odvození této funkce, tedy popis, jak funkci dostat ze základních funkcí postupným užíváním operátorů skládání, minimalisace a primitivní rekurse. Důkaz Matijasevičovy dává diofantickou representaci základních funkcí (ta je triviální) a funkcí vznikajících skládáním, primitivní rekursí a minimalisací. Tak jsme neformálně popsali algoritmus, který dostane na vstup Turingův stroj a vyplivne hledanou diofantickou representaci. Uveďme na tomto místě ještě jedno (na první pohled pozoruhodné) tvrzení. 6
Tvrzení 7 (o neuvěřitelném polynomu, Jones, Sato, Wada, Wiens). Množina {α IN : ( a, b,..., z IN) α = = (k + 2) [1 ([wz + h + j q] 2 + [(gk + 2g + k + 1)(h + j) + h z] 2 + +[16(k + 1) 3 (k + 2)(n + 1) 2 + 1 f 2 ] 2 + +[2n + p + q + z e] 2 + [e 3 (e + 2)(a + 1) 2 + 1 o 2 ] 2 + +[(a 2 1)y 2 + 1 x 2 ] 2 + [16r 2 y 4 (a 2 1) + 1 u 2 ] 2 + +[((a + u 2 (u 2 a)) 2 1)(n + 4dy) 2 + 1 (x + cu) 2 ] 2 + +[(a 2 1)l 2 + 1 m 2 ] 2 + [ai + k + 1 l i] 2 + [n + l + v y] 2 + +[p + l(a n 1) + b(2an + 2a n 2 2n 2) m] 2 + +[q + y(a p 1) + s(2ap + 2a p 2 2p 2) x] 2 + +[z + pl(a p) + t(2ap p 2 1) pm] 2 )] } je množina všech prvočísel. Netvrdíme, že důkaz této konkrétní věty je jednoduchý; nám ani tolik nejde o tento konkrétní ošklivý polynom (co komu řekne?), ale o to, že je jednoduché polynomy takového typu algoritmicky generovat. Máme-li Turingův stroj, který rozhoduje o náležení do množiny prvočísel (ta je rekursivní, a tudíž diofantická), lze algoritmicky vygenerovat polynom, který je diofantickou representací množiny prvočísel. Tvrzení 8. Existuje polynom P (x 1, x 2,..., x n ) s celočíselnými koeficienty takový, že diofantická rovnice P = 0 má řešení, právě když neplatí Riemannova hypotéza. Tento (možná na první pohled překvapivý) výsledek je snadným důsledkem faktu, že množina protipříkladů Riemannovy hypotézy je rekursivně spočetná (to není přesné, neboť tyto protipříklady mohou být komplexní čísla s iracionální imaginární částí, nicméně záhy to alespoň zhruba vyjasníme). Riemannova hypotéza je stále otevřený problém a považuje se za jednu z nějtěžších otevřených otázek matematiky. Podobně jako problém P =? NP je v seznamu Millenium Problems Clayova matematického institutu (www.claymath.org) a na jeho vyřešení je vypsána odměna milion USD. Otázku po důkazu nebo vyvrácení Riemannovy hypotézy též zdůraznil David Hilbert na matematickém kongresu v roce 1900; Riemannova hypotéza se proto někdy označuje jako osmý Hilbertův problém (a narozdíl od desátého problému zůstává nevyřešena dodnes). Přehled všech třiadvaceti 7
problémů a stav jejich řešení lze najít ve Wikipedii (http://en.wikipedia.org/wiki/hilbert%27s problems). Riemannova zeta-fuknce je definována vzorcem ζ(x) = 1 i=1. Pro reálná x n x známe všelijaké vlastnosti této funkce; snadno se nahlédne, že ζ(1) diverguje, ζ(2) = π2 (což ale není tak úplně snadné). ζ(3) 1.202; to je tzv. Apéryho 6 konstanta; Apéry v roce 1979 (!) dokázal, že toto číslo je iracionální. Pro ζ(5), ζ(7),... je (i)racionalita otevřený problém. Je však známo, že alespoň jedno z čísel ζ(5), ζ(7), ζ(9) a ζ(11) je iracionální (tzv. Zudilinova věta). Jako funkce komplexní proměnné c se ζ(c) chová trochu složitěji. Lze ukázat, že řada 1 i=1 konverguje pro libovolné c C s Re c > 1 (Re značí reálnou n c část komplexního čísla), a že na této množině definuje analytickou funkci (to znamená, že má všechny (komplexní) derivace a na okolí každého bodu se rovná svému Taylorovu rozvoji). Lze sestrojit její (jednoznačné) analytické rozšíření na skoro celou komplexní rovinu, totiž na množinu C\{1}. Hovoří-li se o Riemannově zeta-funkci jako o funkci komplexní proměnné, má se na mysli na toto rozšíření. O Riemannově zeta-funkci je známo mnoho; jedno její vyjádření je například 1 1 n ( ) n ζ(c) = ( 1) k 1 1 2 1 c 2 n+1 k (k + 1) c platné pro c C \ {1}. n=0 ζ(c) je na C meromorfní, má jediný, a to jednoduchý, pól v bodě 1. (Připomeňme, že meromorfní funkce na C je funkce, která má komplexní derivaci ve všech bodech C s výjimkou nanejvýš spočetné množiny isolovaných bodů (tzv. pólů); v našem případě je pól jediný, c = 1. Tento pól je jednoduchý: lim c 1 (c 1)ζ(c) konverguje, takže k přebití divergence funkce ζ v bodě 1 stačí ζ přenásobit lineární funkcí.) Takže, shrnuto, chtělo by se říci, je to docela hezká funkce. Není těžké dokázat, že pro čísla c = 2, 4, 6,... je ζ(c) = 0, to jsou tzv. triviální řešení rovnice ζ(c) = 0. Pak existuje řada netriviálních řešení, a všechna dosud známá řešení (ví se, že je jich nekonečně mnoho) mají tvar c = 1 + ix, kde x 2 je nějaké reálné číslo. Riemannova hypotéza tvrdí: všechna netriviální řešení mají tento tvar. Dále lze ukázat, že veškerá netriviální řešení mají reálnou část z intervalu (0, 1) a existuje-li netriviální řešení c = y + ix s y (0, 1 ), pak existuje také 2 8 k=0
netriviální řešení tvaru (1 y) + ix. Dále se ví, že všechna řešení rovnice ζ(c) = 0 jsou symetrická kolem reálné osy. Takže, pokud bychom chtěli vyvrátit Riemannovu hypotézu, stačí prohledávat množinu čísel {y + ix : y ( 1, 1), x > 0}. Na těchto poznatcích lze postavit algoritmus, který bude protipříklady Riemannovy hypotézy systematicky hledat. Jedna z možností je 2 následující. Snadno se nahlédne, že pro každý obdélník v pásu {y + ix : y ( 1, 1), x > 2 0} je Z = 1 ζ (c) 2πi ζ(c) dc = počet řešení rovnice ζ(c) = 0 uvnitř. (ζ je komplexní derivace ζ.) Má-li totiž uvnitř obdélníku funkce ζ nulový bod, má tamtéž funkce ζ jednoduchý pól (derivace je tam nenulová), a ζ 1 podle residuové věty pak integrál (s normalisací ) přes jednoduchou uzavřenou křivku počítá póly uvnitř. (Absolutní hodnota je zde jen proto, 2πi abychom se nemuseli trápit s orientací obdélníku.) Hodnotu Z lze numericky aproximovat, a dokonce chytře aproximovat: lze ukázat, že odchýlí-li se chytrá aproximace od nuly hodnotě dostatečně daleko, už nutně je Z 0. S tímto poznatkem se dá sestavit algoritmus, který bude systematicky aproximovat hodnoty Z pro všechny obdélníky Z s racionálními souřadnicemi. Přesněji: program bude enumerovat devítice přirozených čísel (a, a, b, b, c, c, d, d, e) a jestliže budou čísla a + b i a c + d i uvnitř pásu a b c d {y + ix : y ( 1, 1), x > 0}, vezme tato čísla za souřadnice dvou protilehlých 2 vrcholů obdélníku a provede e kroků aproximace Z. Jakmile by program našel nějakou hodnotu Z 0, nalezl i protipříklad Riemannovy hypotézy, napíše na výstup jedničku a skončí. Jinak bude počítat dále. Diofantická representace P tohoto algoritmu je přesně tvrzení věty: diofantická rovnice P (1, y 1,..., y m ) = 0 má řešení, právě když algoritmus skončí a na výstup dá z = 1, právě když Riemannova hypotéza neplatí. Tím jsme vlastně ukázali, že Riemannova hypotéza je ekvivalentní platnosti jisté uzavřené aritmetické Π 1 -formule ve standarních přirozených číslech. (Jistě by byl hezký výsledek, kdyby se ukázala ekvivalence Riemannovy hypotézy s nějakou Σ 1 -formulí; pak by byla, podle Postovy věty, rozhodnutelná algoritmicky.) Je známa dlouhá řada tvrzení ekvivalentních Riemannově hypotéze; zatím však důkaz ekvivalence s Riemannovou hypotézou slouží spíše jako důkaz 9
obtížnosti daného problému, než jako cesta k odpovědi na Riemannovu hypotézu. Jedna známá ekvivalentní formulace (tzv. Lagariasovo tvrzení) je: pro každé n 1 platí T n, kde T n je tvrzení d n d H n + e Hn ln H n, přičemž rovnost nastává pouze pro n = 1 (H n := n 1 k=1 je n-té harmonické k číslo). Z toho plyne rekursivní spočetnost množiny {n : T n neplatí}, a tedy i algoritmická možnost vyvrátit Riemannovu hypotézu, jestliže tato neplatí, okamžitě. Jistě není překvapením, že i tzv. Goldbachovu doměnku (tvrzení každé přirozené číslo je součtem dvou prvočísel ), jež rovněž patří mezi slavné otevřené problémy, lze převést na otázku řešitelnosti jisté diofantické rovnice: i množina protipříkladů Goldbachovy doměnky je rekursivně spočetná. Rekursivně spočetná je i množina {(a, b, c, n) : a n + b n = c n ; a, b, c, n IN, n 3} (tzv. Fermatova velká (též poslední) věta). Množina je opět rekursivně spočetná a lze ji tedy representovat jistou diofantickou rovnicí; dnes je však již znám slavný výsledek (Wiles, 1994), že tato množina je dokonce rekursivní je prázdná. Je na místě reformulovat tvrzení Matijasevičovy věty i aritmeticky. Řekneme, že formule f(x 1, x 2,..., x n ) je diofantická, jestliže je tvaru ( y 1, y 2,..., y n )(P = Q), kde P a Q jsou polynomy v proměnných x a y. Důsledek 9. Ke každé Σ 1 -formuli f(x 1,..., x n ) existuje diofantická formule g(x 1,..., x n ) taková, že pro každé x 1,..., x n IN platí IN = f(x 1,..., x n ) g(x 1,..., x n ). Během důkazu Matijasevičovy věty uvidíme, že asi nejtěžší krok v důkazu tohoto tvrzení je nalezení diofantické representace omezeného obecného kvantifikátoru, který se může vyskytovat ve formuli f. V čem bude jádro celé práce: uvažme pro příklad, že formule f(u, v) je tvaru ( x < v)( y)g(y, x, u), kde g je v nějakém smyslu jednoduchá (není zde důležité toto vágní vyjádření blíže precisovat). Formule říká, že jsou-li dána u a v, tak ke každému x pod 10
v máme číslo y, které dosvědčuje platnost g(y, x, u). Můžeme na to nahlížet tak, že k danému u a v se ve formuli skrývá funkce ν : x y definovaná pro x < v, která číslům x = 1, 2,..., v 1 přiřazuje svědky y. Při hledání diofantické representace formule f budeme hledat formuli h (zhruba) tvaru ( z)k(u, v, z), kde k je rovnost dvou polynomů v proměnných u, v, z. Budeme postaveni před tento úkol: je-li dáno u a v, musíme vhodným způsobem zakódovat do jediného čísla z informaci o všech svědcích y příslušících číslům x = 1, 2,..., v 1. Musíme tedy vhodným způsobem vytvořit jakéhosi supersvědka z, který najednou dosvědčí platnost ( x < v)( y)g(y, x, u), takže do čísla z musíme zakódovat celou funkci ν. Obtížný krok důkazu je právě v sestrojení tohoto zakódování můžeme totiž kódovat pouze diofantickými prostředky. Číslo z může obecně být strašně veliké; bude proto třeba najít diofantické prostředky pro vyjádření rychle rostoucích funkcí. Proto nejprve vyvineme nemalé úsilí k nalezení diofantické representace funkcí ( n k), n! a x n, bez nichž se tato konstrukce neobejde. Matijasevičova věta má ještě jeden důležitý důsledek. Důsledek 10 (věta o representaci). Nechť T je bezesporná teorie s rekursivní mnižnou axiomů, jež obsahuje Robinsonovu aritmetiku. (a) V teorii T jsou representovatelné částečně rekursivní funkce a rekursivně spočetné predikáty. Dokonce, existuje formule, jež representuje danou částečně rekursivní funkci (predikát) ve všech takových teoriích. (b) Silně representovatelné predikáty jsou právě predikáty rekursivní. Věta o representaci je důležitý důsledek, který nám přenáší algoritmy do světa Robinsonovy aritmetiky RA a jejích různých rozšíření, např. RA, I open, RA, IΣ 0, RA, IΣ 1, PA. Díky této větě se (částečně) rekursivní funkce a rekursivně spočetné (rekursivní) predikáty stávají objekty, o kterých hovoří formální aritmetické teorie různé síly. Můžeme si pak klást otázky, co dokáží různě silné či slabé teorie o nich dokázat. Měli bychom však nejprve přesněji říci, co myslíme pojmem representace. Definice 11. Buď T bezesporná teorie s rekursivní množinou axiomů. Řekneme, že formule f representuje funkci h v teorii T, jestliže platí T f(x 1, x 2,..., x n, ζ) ζ = h(x 1,..., x n ). (3) (symboly s jsou numerály, např. 2 = 2 = s(s(o)) nebo 1 2π e x2 /2 dx = s(o), tedy objekty jazyka aritmetiky zapsané meta-jazykově). 11
Formule f representuje predikát A v teorii T, jestliže platí A(x 1, x 2,..., x n ) implikuje T f(x 1, x 2,..., x n ) a A(x 1, x 2,..., x n ) implikuje T f(x 1, x 2,..., x n ). Formule f silně representuje predikát A v teorii T, jestliže platí A(x 1, x 2,..., x n ) implikuje T f(x 1, x 2,..., x n ) a A(x 1, x 2,..., x n ) implikuje T f(x 1, x 2,..., x n ). Řekneme, že funkce či predikát je (silně) representovatelný v teorii T, jestliže existuje příslušná (silná) representace. Je patrné, že formule, o které tvrzení věty hovoří, je diofantická representace částečné rekursivní funkce, resp. predikátu (k tomu však uvedeme za chvíli drobnou poznámku). Diofantická representace má právě tvar (existenční kvantifikace) následovaná rovností dvou polynomů: f(x 1, x 2,..., x n, z) = = ( y 1, y 2,..., y m )(P (z, x 1,..., x n, y 1,..., y m ) = Q(z, x 1,..., x n, y 1,..., y m )) (připomeňme zde konvenci ze str. 4). Základním jazykem rozumíme jazyk, který kromě symbolů pro proměnné obsahuje pouze rovnost, sčítání a násobení (nic jiného k vyjádření rovnosti dvou polynomů nepotřebujeme). Podívejme se na definici a větu o representovatelnosti malinko podrobněji. Nejobtížnější je dokázat representovatelnost v Robinsonově aritmetice, která je z uvedených systémů nejslabší (nemá žádnou indukci). Matijasevičova věta (v souladu s konvencí ze str. 4) nám dává polynomy P a Q takové, že pro libovolná přirozená čísla z, x 1, x 2,..., x n platí z = h(x 1, x 2,..., x n ) právě když IN = ( y 1, y 2,..., y m )P (z, x 1,..., x n, y 1,..., y m ) = Q(z, x 1,..., x n, y 1,..., y m ). 12
Využijeme-li Σ 1 -úplnost Robinsonovy aritmetiky (připomeňme: to je věta, která říká, že pro libovolnou uzavřenou Σ 1 formuli g platí, že RA g, právě když IN = g), dostáváme i, že z = h(x 1, x 2,..., x n ) právě když RA ( y 1, y 2,..., y m )P (z, x 1,..., x n, y 1,..., y m ) = Q(z, x 1,..., x n, y 1,..., y m ), a pak lze odvodit RA ζ = h(x 1, x 2,..., x n ) [( y 1, y 2,..., y m ) P (ζ, x 1,..., x n, y 1,..., y m ) = Q(ζ, x 1,..., x n, y 1,..., y m )], čímž je v Robinsonově aritmetice dokázána implikace v (3) z definice representace částečně rekursivních funkcí, a tudíž i v silnějších teoriích, které ji obsahují. Implikace v (3) činí ve slabých teoriích trochu problémy. Problém je totiž tento: formule [( y 1,..., y m )P (ζ, y 1,..., y m ) = Q(ζ, y 1,..., y m )] ζ = h(x 1, x 2,..., x n ) (4) nemusí být splněna v některém nestandardním modelu RA; tam mohou existovat nestandardní y 1, y 2,..., y m taková, že rovnost polynomů platí, a přitom ζ h(x 1, x 2,..., x n ) (třeba proto, že ζ je nestandardní, zatímco h(x 1, x 2,..., x n ) je numerál, a tudíž jej v každém nestandardním modelu realisuje standardní přirozené číslo). Chtěli bychom ukázat, že RA dokazuje formuli (4), což je podle věty o úplnosti predikátové logiky ekvivalentní platnosti v každém modelu. Víme (z Matijasevičovy věty), že (4) platí ve standardních přirozených číslech IN (to je jen jeden z mnoha možných modelů RA), avšak to k dokazatelnosti nestačí. Nicméně existuje cesta, jak tento problém řešit. Z Matijasevičovy věty víme, že formule f(x 1, x 2,..., x n, z) = ( y 1,..., y m )P (z, y 1,..., y m ) = Q(z, y 1,..., y m ) popisuje v IN funkci, a samozřejmě je tato formule Σ 1. Lze ukázat, že potom se jen malou modifikací f dostane formule f, která je Σ 1 a možné patologické nestandardní modely odbourá, a lze ji tudíž užít jako formuli representující příslušnou částečnou rekursivní funkci v RA splňující (3). Detaily o f a důkaz lze najít v [Sochor], str. 215, věta 2. Věta o representovatelnosti říká, že je možné i ve slabých aritmetikách, které znají jen rovnost, sčítání a násobení, o algoritmech mluvit. Nic neříkáme o tom, co umí Robinsonova aritmetika o těchto funkcích dokázat; vždyť neumí dokázat ani ( a, b)(a + b = b + a), takže si nedělejme velké iluse. Například, exponenciální funkce je rekursivní, a tedy representovatelná, ale lze ukázat, že RA, IΣ 0 exponenciální funkce je totální (uvozovky znamenají formalisaci tvrzení uvnitř). 13
Všimněme si krátce rozdílu mezi representovatelností a silnou representovatelností. Silná representovatelnosti je opravdu silnější než jen representovatelnost. V definici representovatelnosti jen požadujeme, aby teorie cosi nepříjemného nedokazovala; v definici silné representovatelnosti požadujeme, aby byla silnější, aby dokazovala dokonce negaci. Je však zřejmé tvrzení věty (b): silná representace ja vlastně reformulace Postovy věty. Pro rekursivní predikát A(x) (řekněme, pro jednoduchost, s jednou proměnnou) podle Postovy věty platí, že A(x) i A(x) jsou rekursivně spočetné, tedy mají oba Σ 1 representaci (dokonce diofantickou): (α) A(x) právě když ( y)(p (x, y) = Q(x, y)); (β) A(x) právě když ( y)(p (x, y) = Q(x, y)) právě když (γ) právě když ( z)(r(x, z) = S(x, z)) (použli jsme zkratku y za y 1, y 2,..., y m, podobně z). Z toho plyne silná representovatelnost: podle (α) a Σ 1 -úplnosti RA je RA ( y)(p (x, y) = Q(x, y)), podle (γ) je RA ( z)(r(x, y) = S(x, y)) a tudíž podle (β) se nahlédne, že i RA ( y)(p (x, y) = Q(x, y)), takže RA f i RA f (to je definice silné representace). (Upozorněme, že ( y)(p (x, y) = Q(x, y)) obecně narozdíl od této naší situace, kdy A je rekursivní nemusí být Σ 1 formule.) Na druhou stranu, je-li predikát silně representovatelný, je rekursivní. Silná representovatelnost totiž implikuje existenci algoritmu, který pro dané x rozhodne, zdali A(x) nebo A(x). Stačí totiž enumerovat všechny důkazy teorie (předpokládali jsme, že teorie má rekursivní množnu axiomů) a čekat, kdy narazíme na důkaz A(x) nebo A(x), dříve nebo později se jeden z nich objevit musí. Že je tato procedura rekursivní (jinými slovy: vždy po konečně mnoha krocích skončí), zaručuje silná representovatelnost. Uvedené důsledky lze dále prohlubovat. Důkaz Matijasevičovy věty lze formalisovat v teorii RA, IΣ 1 (a dokonce i v RA, IΣ 0 (exp)). Důkaz, který my předvedeme na metahladině, lze vhodným způsobem reformulovat uvnitř poměrně slabé teorie RA, IΣ 1 (a dokonce i ve slabších). Důkaz následujícího tvrzení by tedy spočíval v tom, že náš metajazykový důkaz Matijasevičovy věty, který záhy podáme, bychom přeformulovali důkazovými prostředky, které jsou k disposici uvnitř RA, IΣ 1, což je s jistým úsilím možné. Tvrzení 12 (Matijasevič v RA, IΣ 1 ).. Ke každé Σ 1 -formuli f(x 1, x 2,..., x n ), jejíž Gödelovo číslo je f, existuje číslo g, přičemž g je číslem diofantické 14
formule (existenční kvantifikace následovaná rovností dvou polynomů) s n proměnnými taková, že RA, IΣ 1 ( x)(sat( f, x) Sat( g, x)), kde Sat(q, x) je formule, jež v RA, IΣ 1 formalisuje tvrzení x je kódem n- tice čísel, která splňují Σ 1 -formuli s n volnými proměnnými, jejíž číslo je q. Detaily viz [Hájek, Pudlák], kap. 3(d). Všimněme si explicitně ještě jednoho samozřejmého, leč důležitého důsledku Matijasevičovy věty. Důsledek 13. Neomezená obecná kvantifikace a negace nezachovávají diofantičnost. Kdyby negace zachovávala diofantičnost, tak bychom měli pro každý diofantický predikát P, že i P je diofantický. To ovšem není možné, vezměme za P nějaký Σ 1 -úplný, např. x W x (halting problem). Potom je P Π 1 - úplný a tudíž P Σ 1 (množina K není rekursivně spočetná). Proto nemůže mít diofantickou representaci (ta je Σ 1 ). Podobně se nahlédne, že obecně nezachovává diofantičnost; vždyť obecnou kvantifikací ( x)p bychom mohli dostat Π 2 predikát, který není v Σ 1. Je tedy třeba dávat pozor: někdy negace zachovává diofantičnost (je-li použita rekursivně ) a někdy nikoliv. Na tomto místě tedy upozorňujeme, že se budeme negaci a neomezené obecné kvantifikaci vyhýbat. I proto jsou některé obraty na první pohled trochu umělé: neříkáme třeba x y (tam je skryta negace), ale říkáme (vlastně tedy ( z)[(x y) 2 = z + 1] ( z)[(x x) + (y y) = (s(s(o)) (x y)) + (z + s(o))], abychom se vyjádřili přímo jazykem aritmetiky), což je v aritmetice totéž, leč bez negace. Shrňme důležité věci. Matijasevičova věta říká, že každá Σ 1 -formule má diofantickou representaci (těžký krok důkazu je najít diofantickou representaci 15
omezeného obecného kvantifikátoru). Třída diofantických formulí je uzavřená na primitivní rekursi a minimalisaci, pročež třída částečně rekursivních funkcí = třída diofantických funkcí. Podobně třída rekursivně spočetných predikátů (množin přirozených čísel, relací) = třída diofantických predikátů (množin přirozených čísel, relací). Z ekvivalence mezi Turingovými stroji a částečně rekursivními funkcemi (a rekursivně spočetnými predikáty) plyne ekvivalence Turingových strojů s diofantickými funkcemi a predikáty (a též s dalšími formalisacemi pojmu algoritmus, např. s Chomského gramatikami typu 0, pokud se s mini čtenář někdy například při nákupu v zelenině setkal). Důkaz Matijasevičovy věty je konstruktivní, takže vlastně dává algoritmus, jak k danému Turingovu stroji sestavit jeho diofantickou representaci. Důsledkem Matijasevičovy věty je i representovatelnost algoritmů v aritmetických teoriích, a to velmi jednoduchým způsobem. Dalším důležitým důsledkem je i neexistence algortmu, který by rozhodoval o řešitelnosti diofantických rovnic (záporná odpověď Hilbertovi na jeho desátou otázku.) Matijasevičovu větu lze zformalisovat i uvnitř poměrně slabých teorií (např. RA, IΣ 1 ). * Jízdní řád. Vydáme se nyní na cestu k důkazu věty. Dokážeme, že třída diofantických funkcí je uzavřená na primitivní rekursi a minimalisaci, z čehož už vyplyne, že každá částečná rekursivní funkce je diofantická (viz ještě jednou důkaz triviální implikace věty 5). (i) Nejprve uvedeme několik snadných lemmat (lemma 14, 15) o počítání s čísly a polynomy. Vesměs jde o snadná cvičení. Celý důkaz Matijasevičovy věty je postaven na důmyslém užití kongruencí, (ne)soudělnosti a dělitelnosti přirozených čísel, takže tato lemmata uvádíme spíše proto, aby si čtenář uvědomil časté (i když jednoduché) obraty, které se mnohokrát užívají. (ii) Dokážeme čínskou větu o zbytcích (věta 7). Jde o snadné, leč velmi výtěžné tvrzení: zajistí existenci vhodného čísla při konstrukci diofantické representace omezeného obecného kvantifikátoru (věta 45) a při konstrukci diofantické funkce, jež kóduje konečné posloupnosti čísel do čísla jediného (věta 47). Protože jde však o větu, která má široké užití, ukážeme i některé další její souvislosti; ty však nejsou pro Matijasevičovu větu podstatné a lze je přeskočit. (iii) Dokážeme, že pelliána (diofantická rovnice tvaru x 2 y 2 d = 1, kde d je konstanta taková, že d není celé číslo), má v IN 2 nekonečně mnoho řešení. 16
(Triviální řešení x = ±1, y = 0 je vidět na první pohled.) Ukážeme, že řešení lze enumerovat dvojicí jistých funkcí A(n) a B(n) a že ke každému řešení x, y IN existuje n tak, že x = A(n) a y = B(n). Práce s pelliánou bude mít dva velké kroky: nejprve ukážeme, že pelliána má nějaké netiviální řešení (věta 29). Důkaz je zajímavý sám o sobě, notně využívá tzv. Dirichletova (též holubníkového) principu a otvírá dveře ke studiu svébytné teorie. Druhý krok spočívá v tom, že množinu řešení popíšeme pomocí jisté grupy a efektivně popíšeme funkce A a B. Nechť si čtenář všimne, že ačkoliv důkaz existence netriviálního řešení pelliány je toliko existenční, konečná charakterisace množiny řešení funkcemi A a B už množinu řešení popisuje konstruktivně. (iv) Funkce A(n) a B(n) (které přeznačíme na A a B) budeme zkoumat dále. Ukáže se, že funkce B je na naší cestě velmi vhodná, neboť je diofantická (věta 39) a lze jejím prostřednictvím najít diofantickou representaci exponenciální funkce (41). (v) Je třeba ukázat řadu triviálních i méně triviálních vlastností funkcí A a B. Základem pro lemmata 37 a 38 je především Moivreova věta (pozorování 34), opět sama o sobě pozoruhodná. Mezi důležitými vztahy zde alespoň jmenujme, že čísla A(n) a B(n) jsou nesoudělná, operátor B zachovává dělitelnost (lemma 38(a)) a funkce B(n) roste rychle. Čtenář může kapitoly 5 a 6 brát jen jako technickou vsuvku a vracet se k nim ve chvílích, kdy se na ně odvolávají další věty. (vi) Ukážeme, že funkce B je diofantická. K tomu dobře poslouží právě pelliána je to diofantická rovnice, tedy přímo objekt vyjádřitelný jazykem aritmetiky. (vii) Díky tomu, že funkce B roste rychle (exponenciálně) a je diofantická, už dokážeme zkonstruovat diofantickou representaci exponenciální funkce y = z n. Zde končí první velký krok důkazu. (Připomeňme zde analogii se slabými aritmetickými teoriemi, jako je např. RA, IΣ 0 ; zde je hlavní problém taktéž v definici funkcí, které rychle rostou v takových teoriích máme bezprostředně k disposici pouze sčítání, násobení a jen velmi slabou indukci, a je tudíž nesnadné s těmito prostředky vybudovat rychle rostoucí funkce, o nichž by tyto teorie dokázaly alespoň základní fakta.) Jakmile máme k disposici exponenciální funkci, mnohé se láme: s její pomocí je již možné přistoupit např. ke kódování konečných posloupností přirozených čísel. (My tak učiníme 17
až později.) (viii) Pomocí exponenciální funkce zkonstruujeme diofantickou representaci binomického koeficinetu a faktoriálu (9). Nyní se již ukazuje, že jde zdiofantisovat více, než by člověk na první dojem očekával. (ix) Druhý velký krok důkazu spočívá v tom ukázat, že omezená obecná kvantifikace je diofantická (narozdíl od omezené i neomezené existenční kvantifikace). Je totiž třeba ukázat, že k formuli typu A(x, n) = ( i < n)( y)[p (x, y, i) = 0] (ke každému i pod n najdeme svědka y, jenž dokládá platnost P ), existuje vhodná formule typu ( z)q. Věta 45 je vlastně důmyslné zakódování existenčních svědků pro každé i do velesvědka z, který v sobě obsáhne informaci o všech svědcích y pro i n pomocí dosud odvozených diofantických funkcí, tj. pomocí eponenciály, binomického koeficientu a faktoriálu. (x) Po tomto kroku je již vše snadné. Omezený obecný kvantifikátor je totiž silný vyjadřovací nástroj, takže se snadno ukáže konstrukce diofantického kódování konečných posloupností přirozených čísel do čísla jediného (věta 47) a diofantičnost primitivní rekurse a minimalisace (48). Tím bude důkaz hotov. 1 Čísla a základní diofantické relace a funkce Nejprve zde uveďme několik jedoduchý faktů o celých číslech (obecně celých, často však pracujeme jen s přirozenými). Řekneme, že číslo a je dělitelem čísla b (nebo jen a dělí b) a píšeme a b, jestliže pro nějaké k je b = ka. Číslo a je kongruentní s b modulo c, což zapisujeme a c b (někdy se též píše a b mod c), jestliže pro nějaké k je a = kc + b, nebo, jinými slovy, c (a b). Tuto relaci lze ještě reformulovat tak, že zbytek (braný v intervalu 0, 1,..., c 1) po celočíselném dělení čísla a číslem c je stejný jako zbytek po celočíselném dělení čísla b číslem c. Takže například 10 3 1 3 8. Čísla jsou nesoudělná, jestliže jejich prvočíselné rozklady mají prázný průnik; jinými slovy, největším společným dělitelem dvou nesoudělných čísel je 18
jednička. Všimněme si například, že je-li číslo a nesoudělné s číslem b!, pak všichni prvočinitelé a musí být větší než b (což budeme využívat). Definujeme funkce div(a, b) = k a mod(a, b) = r, kde k a r jsou dány z rozkladu a = kb + r (k je celočíselný podíl a r zbytek po celočíselném dělení) takové, že r {0, 1,..., b 1}. Následující dvě lemmata jsou velmi jednoduchá. Lemma 14 (o dělitelnosti). (a) Nechť číslo d > 1 dělí číslo a a nedělí b. Pak d nedělí a + b. (b) Nechť a m l, x m ab. Pak x m lb. (c) Nechť a m b a d m. Pak a d b. (d) Buďte a, m, b 0. Pak z a m b a b < m plyne a = mod(a, m). (e) Nechť čísla a, b jsou nesoudělná a platí c a d a c b d. Pak c ab d. Důkaz je směšný; rozeberme např. (b): podle předpokladu existují k 1 a k 2 tak, že a = k 1 m + l, x = k 2 m + ab = k 2 m + (k 1 m + l)b = (k 2 + k 1 b)m + lb, takže x m lb. Lemma 15 (o polynomech). (a) Nechť P (x 1, x 2,..., x n ) je polynom a celá čísla y 1, y 2,..., y n taková, že P (y 1, y 2,..., y n ) = 0. Pak číslo P (k 1 p + y 1, k 2 p + y 2,..., k n p + y n ) je dělitelné číslem p. (b) Nechť P (a, x 1, x 2,..., x n ) je polynom. Pak se polynom P (a, k 1 p+x 1, k 2 p+x 2,..., k n p+ x n ) dá psát ve tvaru Q(p)+P (a, x 1, x 2,..., x n ), kde Q(p) je polynom bez absolutního členu (tj. dělitelný p). (c) Nechť P (x) je polynom. Pak pro čísla b 1, b 2 platí P (b 1 ) b1 b 2 P (b 2 ). Důkaz (a) provedeme třeba pro n = 3, pro jiná n je to stejné (jen je pro větší n zápis perverznější). Polynom tří proměnných lze psát ve tvaru P (x 1, x 2, x 3 ) = a i1 i 2 i 3 x i1 1 x i 2 2 x i 3 3 i 1,i 2,i 3 (sumace běží přes přirozená čísla i 1, i 2, i 3 v rozmezí od nuly až po jisté číslo podle stupně polynomu v té které proměnné.) Podle binomické věty je (bereme konvenci ( 0 0) = 1, 0 i=1 = 19
0): P (k 1 p + y 1, k 2 p + y 2, k 3 p + y 3 ) = = [ y i 2 2 + [ i2 m 2=0 i 2 m 2 =1 ( i2 a i1i 2i 3 (k 1 p + y 1 ) i1 (k 2 p + y 2 ) i2 (k 3 p + y 3 ) i3 = i 1,i 2,i 3 = [ i1 ( ] i1 )(k 1 p) m1 (y 1 ) i1 m1 m 2 = ( i2 i 1,i 2,i 3 a i1 i 2 i 3 m 1 =0 )(k 2 p) m 2 (y 2 ) i 2 m 2 ] i 1,i 2,i 3 a i1i 2i 3 m 2 [ y i1 1 + i1 m 1 =1 )(k 2 p) m2 (y 2 ) i2 m2 ] m 1 [ i3 m 3=0 ( i1 [ m 1 y i 3 3 + ( i3 m 3 )(k 3 p) m 3 (y 3 ) i 3 m 3 ] )(k 1 p) m 1 (y 1 ) i 1 m 1 ] i 3 m 3 =1 ( i3 m 3 = )(k 3 p) m3 (y 3 ) i3 m3 ] = [ ] [ a i1i 2i 3 y i1 1 + S 1 y i 2 ] [ 2 + S 2 y i 3 ] 3 + S 3, i 1,i 2,i 3 kde jsme S 1, S 2, S 3 označili vnitří sumy. Čísla S i (i = 1, 2, 3) jsou evidentně dělitelná k i (k i lze vytknout). Když nyní roznásobíme hranaté závorky v posledním výrazu člen po členu, dostaneme (dlouhý) součet, přičemž jediný sčítanec y i1 1 yi2 2 yi3 3 neobsahuje žádné S, všechny ostatní sčítance obsahují S a jsou tak dělitelné číslem k. Proto můžeme poslední sumu psát ve tvaru = 1 y i 2 2 y i 3 3 + číslo dělitelné k ) i 1,i 2,i 3 a i1 i 2 i 3 ( y i1 a roztržením na dvě sumy dostaneme = ( a i1 i 2 i 3 y i1 1 y i 2 2 y i ) 3 3 + i 1,i 2,i 3 i 1,i 2,i 3 a i1 i 2 i 3 (číslo dělitelné k). (5) Levá suma je polynom P (y 1, y 2,..., y n ), takže podle předpokladu je to nula, pročež celý výraz je dělitelný k. Důkaz (b) je jen snadná reformulace (a); hledaný polynom Q je druhá suma ve výrazu (5). Na proměnnou a lze nahlížet jako na konstantu, jež je zahrnuta v koeficientech a i1 i 2 i 3. (c) je též jednoduché: polynom P má absolutní člen a 0, takže P (b 1 ) = a 0 + i 1 a i b i 1, P (b 2 ) = a 0 + i 1 a i b i 2, = a P (b 1 ) P (b 2 ) = i 1 a i(b i 1 b i 2) (absolutní členy se odečetly). Každý výraz typu b i 1 b i 2 lze rozložit do tvaru b i 1 b i 2 = (b 1 b 2 )(b n 1 1 + b n 2 1 b 2 + b n 3 1 b 2 2 + + b 1 b n 2 2 + b n 1 2 ) (6) 20