4.5.4 Knapsacks mit geringer Dichte

Einer der besten Algorithmen für das allgemeine Subset-Sum Problem ist der Meet-in-the-Middle Algorithmus.
Für Knapsack-Vektoren mit geringer Dichte gibt es eine effektivere Methode. Hierbei wird das Subset-Sum Problem reduziert auf das Problem, einen Vektor zu finden, der eine kleine Länge hat.

Definition
Gegeben sei ein Knapsack-Vektor A = (a₁, ..., a_n). Sei a_max das größte Element in A: a_max = max_i a_i, i = 1 ... n. Dann ist die Dichte d_A des Knapsack-Vektors A

d_A = n / log₂(a_max)

In Kryptosystemen, die auf dem Subset-Sum Problem basieren, ist die Dichte eines Knapsacks fast immer kleiner als Eins, da andernfalls mehrere Teilmengen A' von A existieren können, die sich zu einer Summe s aufsummieren. Dann wäre eine eindeutige Entschlüsselung nicht mehr möglich.

Definition
Ein Vektor v aus Rⁿ ist ein geordnetes Tupel mit Elementen v_i aus R:

v = (v₁, v₂, ..., v_n), v_i aus R, i = 1 ... n.

Definition
Sei v = (v₁, v₂, ..., v_n) ein Vektor aus Rⁿ. Dann hat v die (euklidische) Länge

||v|| = (v₁² + ... + v_n²)^1/2

Definition
Sei {b_i}_i=1...m eine Menge von Vektoren aus Rⁿ mit m <= n. Genau dann ist {b_i} linear abhängig, wenn es k_i aus R gibt mit

k₁b₁ + k₂b₂ + ... + k_mb_m = 0, nicht alle k_i = 0

Andernfalls ist {b_i}_i=1...m linear unabhängig.

Definition
Sei {b_i}_i=1...n eine Menge von n linear unabhängigen Vektoren aus Rⁿ. Dann ist {b_i}_i=1...n eine Basis für Rⁿ. Jeder Vektor v aus Rⁿ kann eindeutig geschrieben werden kann als Linearkombination der Menge {b_i}_i=1...n

v = k₁b₁ + k₂b₂ + ... +k_nb_n, k_i aus R, i = 1 ... n.

Definition
Seien m linear unabhängige Vektoren {b_i}_i=1...m gegeben, m <= n. Dann ist das Gitter (lattice) L, das von {b_i}_i=1...m erzeugt wird, die Menge aller ganzzahligen Linearkombinationen von {b_i}:

L = {v | v = z₁b₁ + z₂b₂ + ... + z_mb_m, wobei z_i aus Z}

Die Menge {b_i}_i=1...m ist dann eine Basis für L. Ein Gitter kann mehrere Basen besitzen.

Eng verbunden mit einem Gitter L ist das kürzeste-Vektor Problem (SVP: shortest vector problem): für ein gegebenes Gitter L ist der kürzeste Vektor aus L zu finden, der ungleich dem Nullvektor ist.
Nimmt man als Länge eines Vektors die Supremumsnorm, dann ist das Problem NP-hart. Für die euklidische Norm jedoch läßt sich die Aussage nicht machen. Es ist ein offenes Problem.
(Die Supremumsnorm || ||₈eines Vektors v = (v₁, ..., v_n) ist definiert als ||v||₈ = max |v_i|_i=1...n.)

Ein Gitter L kann durch mehrere Basen beschrieben werden. Eine "gute" Basis für ein Gitter besteht aus Vektoren mit möglichst "kleinen" Längen und wird reduzierte Basis gennant. Die Gitter-Reduktions-Theorie befasst sich damit, "gute" Basen für ein Gitter L zu erzeugen.

Algorithmen, die eine gegebene Basis B für ein Gitter L in eine reduzierte Basis überführen, werden Gitter-Basis-Reduktionsalgorithmen genannt. Ein Vertreter dieser Algorithmen ist der nach seinen Entwicklern Lenstra, Lenstra und Lovász benannte L³-Algorithmus. Eine L³-reduzierte Basis hat u.a. die Eigenschaft, dass ihr erster Vektor, b'₁ um höchstens einen exponentiellen Faktor größer ist als der kleinste nichtnull Vektor aus L (bzgl. der euklidischen Länge):

||b'₁|| <= 2^(n-1)/2||v||, v aus L.

Im Folgenden wird gezeigt, wie ein Subset-Sum Problem gelöst werden kann, wenn der Knapsack-Vektor eine geringe Dichte hat. Da kryptographische Knapsack-Vektoren fast immer eine Dichte kleiner als Eins haben, trifft dieses Verfahren auch auf diese zu.

Gegeben öffentlicher Knapsack-Schlüssel B = (b₁, ..., b_n) Chiffre c = pB = b₁p₁ + ... + b_np_n, p_i aus {0, 1}
Gesucht Die Klartextnachricht p

y₁ =	p₁ + 0 + ... + 0 - 0.5 = p₁ - 0.5
y₂ =	0 + p₂ + 0 + ... + 0 - 0.5 = p₂ - 0.5
...
y_i =	0 + ... + 0 + p_i + 0 + ... +0 - 0.5 = p_i - 0.5
...
y_n =	0 + ... + 0 + p_n - 0.5 = p_n - 0.5
y_n+1 =	t(b₁p₁ + b₂p₂ + ... + b_np_n) - tc = 0

M =
	1	0	0	...	0	tb₁
	0	1	0	...	0	tb₂
	0	0	1	...	0	tb₃
	...	...	...	...	...	...
	0	0	0	...	1	tb_n
	0.5	0.5	0.5	...	0.5	tc