Complexité du circuit OR d'un opérateur linéaire dense

Considérez le modèle de circuit monotone simple suivant: chaque porte est juste un OU binaire. Quelle est la complexité d'une fonction $f(x)=Ax$ où $A$ est une matrice booléenne $n \times n$ avec $O(n)$ 0? Peut-il être calculé par des circuits OR de taille linéaire?

Plus formellement, $f$ est une fonction de $n$ à $n$ bits. La $i$ ième sortie de $f$ est $\bigvee_{j=1}^{n}(A_{ij} \land x_j)$ ( par exemple, un OU du sous - ensemble de bits d'entrée fournis par la -ième rangée de ). $i$ $A$

Notez que 0 divise les lignes de en plages (sous-ensembles composés d'éléments consécutifs de ). Cela permet d'utiliser des structures de données d'interrogation de plage connues. Par exemple, une structure de données de table clairsemée peut être transformée en un circuit OU de taille . L'algorithme de Yao pour les requêtes d'opérateurs de semi-groupe de gamme peut être transformé en un circuit presque linéaire (de taille où est Ackermann inverse) $O(n)$ $A$ $O(n)$ $[n]$ $O(n\log n)$ $O(\alpha(n) \cdot n)$ $\alpha(n)$

En particulier, je ne sais même pas comment construire un circuit de taille linéaire pour un cas spécial où chaque ligne de contient exactement deux zéros. Alors que le cas d'exactement un zéro dans chaque ligne est facile. (Chaque fonction de sortie peut être calculée par un OU d'un préfixe et d'un suffixe , qui peuvent être précalculés par portes OU.) $A$ $[1..k-1]$ $[k+1..n]$ $2n$

ds.algorithms circuit-complexity upper-bounds

— Alexander S. Kulikov
source

Une limite supérieure est connue: elle est au plus rk (A) fois n divisé par log n, où rk (A) est le rang OR d'une matrice booléenne A (= nombre minimum de toutes les 1 sous-matrices dont le OR coïncide avec A ). Voir le lemme 2.5 dans ce livre . Alors, quelle peut être la taille (au maximum) du rang booléen d'une matrice nxn avec O (n) zéros?

— Stasys

@Stasys Merci, Stasys! Déjà pour la matrice à diagonale nulle, le rang OR est linéaire, non?

— Alexander S.Kulikov

Le rang OR de votre matrice (zéro diagonale et 1s ailleurs) est au plus 2 \ log n: étiquetez les lignes / colonnes par des chaînes binaires de longueur \ log n, et considérez les rectangles {(r, c): r (i) = a, c (i) = 1-a} pour a = 0,1. Notez également que le lemme 2.5 est une limite supérieure . Une borne inférieure en termes de rang OR est donnée en Thm. 3.20. En outre, le log de rang OR est exactement la complexité de communication non déterministe des matrices.

— Stasys

@Stasys oh, oui, c'est vrai!

— Alexander S.Kulikov

Réponses:

Il s'agit d'une réponse partielle (affirmative) dans le cas où nous avons une limite supérieure sur le nombre de zéros dans chaque ligne ou dans chaque colonne.

Un rectangle est une matrice booléenne composée d'une sous-matrice tout-1 et comportant des zéros ailleurs. Un rang OR d'une matrice booléenne est le plus petit nombre de rectangles tels que peut être écrit comme un (composant) OU de ces rectangles. Autrement dit, chaque entrée 1 de est une entrée 1 dans au moins un des rectangles, et chaque entrée 0 de est une entrée 0 dans tous les rectangles. Notez que est exactement la complexité de communication non déterministe de la matrice $rk(A)$ $r$ $A$ $A$ $A$ $\log rk(A)$ $A$ (où Alice obtient des lignes et des colonnes Bob). Comme OP l'a écrit, chaque matrice booléenne définit un mappage , où pour . Autrement dit, nous prenons un produit vecteur matriciel sur le semi-booléen. $m\times n$ $A=(a_{i,j})$ $y=Ax$ $y_i=\bigvee_{j=1}^na_{i,j}x_j$ $i=1,\ldots,m$

Le lemme suivant est dû à Pudlák et Rödl; voir la proposition 10.1 dans cet article ou le lemme 2.5 dans ce livre pour une construction directe.

Lemme 1: Pour chaque matrice booléenne , le mappage peut être calculé par un circuit OU de fanin illimité de profondeur 3 en utilisant au plus fils. $n\times n$ $A$ $y=Ax$ $O(rk(A)\cdot n/\log n)$

Nous avons également la borne supérieure suivante sur le rang OR des matrices denses. L'argument est une simple variation de celui utilisé par Alon dans cet article .

Lemme 2: Si chaque colonne ou chaque ligne d'une matrice booléenne contient au plus zéros, alors , où est le nombre de s en . $A$ $d$ $rk(A)=O(d\ln|A|)$ $|A|$ $1$ $A$

Preuve: Construisez une sous-matrice aléatoire tout en en choisissant chaque ligne indépendamment avec la même probabilité . Soit le sous-ensemble aléatoire de lignes obtenu. Alors , que , où est l'ensemble de toutes les colonnes de qui n'ont pas de zéros dans les lignes de . $1$ $R$ $p=1/(d+1)$ $I$ $R=I\times J$ $J$ $A$ $I$

A -entrée de est couvert par si a été choisi en et aucun des (au plus ) des rangées avec un dans la -ième colonne a été choisie en . Par conséquent, l'entrée est couverte avec une probabilité d'au moins $1$ $(i,j)$ $A$ $R$ $i$ $I$ $d$ $0$ $j$ $I$ $(i,j)$ . Si nous appliquons cette procédure fois pour obtenir rectangles, alors la probabilité que soit couverte par aucun de ces rectangles ne dépasse pas . À la limite de l'union, la probabilité qu'uneentrée de de reste découverte est au plus $p(1-p)^{d}\geq pe^{-pd-p^2d}\geq p/e$ $r$ $r$ $(i,j)$ $(1-p/e)^r\leq e^{-rp/e}$ $1$ $A$ $|A|\cdot e^{-rp/e}$ , qui est inférieur à pour . $1$ $r=O(d\ln|A|)$ $\Box$

Corollaire: si chaque colonne ou chaque ligne d'une matrice booléenne contient au plus zéros, le mappage peut être calculé par un circuit OU de fanin illimité de profondeur 3 utilisant des fils . $A$ $d$ $y=Ax$ $O(dn)$

Je suppose qu'une limite supérieure similaire à celle du lemme 2 devrait également tenir lorsque est le nombre moyen de s dans une colonne (ou dans une rangée). Il serait intéressant de le montrer. $d$ $1$

Remarque: (ajouté le 04.01.2018) Un analogue du lemme 2 est également valable lorsque est le nombre moyen maximal de zéros dans une sous-matrice de , où le nombre moyen de zéros dans une matrice est le nombre total de zéros divisé par . Cela découle du théorème 2 de N. Eaton et V. Rödl ;, Graphs of small dimension, Combinatorica 16 (1) (1996) 59-85 . Une limite supérieure légèrement pire $rk(A)=O(d^2\log n)$ $d$ $A$ $r\times s$ $s+r$ peut être dérivé directement du lemme 2 comme suit. $rk(A)=O(d^2\ln^2 n)$

Lemme 3: Soit . Si chaque sous-graphe couvrant un graphe biparti a un degré moyen , alors peut être écrit comme une union , où le degré gauche maximal de et le degré droit maximal de sont . $d\geq 1$ $G$ $\leq d$ $G$ $G=G_1\cup G_2$ $G_1$ $G_2$ $\leq d$

Preuve: Induction sur le nombre de sommets. Les cas de base et sont évidents. Pour l'étape d'induction, nous colorerons les bords en bleu et rouge afin que le degré maximum dans les sous-graphiques bleu et rouge soit . Prenez un sommet de degré ; un tel sommet doit exister parce que le degré moyen de l'ensemble du graphe doit également être . Si appartient à la partie gauche, coloriez toutes les arêtes incidentes à en bleu, sinon colorez toutes ces arêtes en rouge. Si l'on supprime le sommet $n$ $n=1$ $n=2$ $\leq d$ $u$ $\leq d$ $\leq d$ $u$ $u$ $u$ then the average degree of the resulting graph $G$ is also at most $d$ , and we can color the edges of this graph by the induction hypothesis. $\Box$

Lemma 4: Let $d\geq 1$ . If the maximum average number of zeros in a boolean $n\times n$ matrix $A=(a_{i,j})$ is at most $d$ , then $rk(A)=O(d^2\ln^2 n)$ .

Proof: Consider the bipartite $n\times n$ graph $G$ with $(i,j)$ being an edge iff $a_{i,j}=0$ . Then the maximum average degree of $G$ is at most $d$ . By Lemma 3, we can write $G=G_1\cup G_2$ , where the maximum degree of the vertices on the left part of $G_1$ , and the maximum degree of the vertices on the right part of $G_2$ is $\leq d$ . Let $A_1$ and $A_2$ be the complements of the adjacency matrices of $G_1$ and $G_2$ . Hence, $A= A_1\land A_2$ is a componentwise AND of these matrices. The maximum number of zeros in every row of $A_1$ and in every column of $A_2$ is at most $d$ . Since $rk(A)\leq rk(A_1)\cdot rk(A_2)$ , Lemma 2 yields $rk(A)=O(d^2\ln^2 n)$ . $\Box$

N.B. The following simple example (pointed by Igor Sergeev) shows that my "guess" at the end of the answer was totally wrong: if we take $d=d(A)$ to be the average number of zeros in the entire matrix $A$ (not the maximum of averages over all submatrices), then Lemma 2 can badly fail. Let $m=\sqrt{n}$ , and put an identity $m\times m$ matrix in, say left upper corner of $A$ , and fill the remaining entries by ones. Then $d(A)\leq m^2/2n < 1$ but $rk(A)\geq m$ , which is exponentially larger than $\ln|A|$ . Note, however, that the OR complexity of this matrix is very small, is $O(n)$ . So, direct arguments (not via rank) can yield much better upper bounds on the OR complexity of dense matrices.

— Stasys
source

Thanks a lot, Stasys! This is nice! In the meantime, Ivan Mihajlin came with another proof. I've posted it below.

— Alexander S. Kulikov

(I tried to post this as a comment to Stasys' answer above, but this text is too long for a comment, so posting it as an answer.) Ivan Mihajlin (@ivmihajlin) came up with the following construction. Similarly to Stasys' proof, it works for the case when the maximum (rather than average) number of 0’s in each row is bounded.

First, consider the case when every row contains exactly two zeros. Consider the following undirected graph: the set of vertices is $[n]$ ; two nodes $i$ and $j$ are joined by an edge, if there is a row having zeros in columns $i$ and $j$ . The graph has $n$ edges and hence it contains a cut $(L,R)$ of size at least $n/2$ . This cut splits the columns of the matrix into two parts ( $L$ and $R$ ). Let now also split the rows into two parts: the top part $T$ contains all columns that have exactly one zero in both $L$ and $R$ ; the bottom part $B$ contains all the remaining rows. What is nice about the top part of the matrix ( $T \times (L \cup R)$ ) is that it can be computed by $O(n)$ gates. For the bottom part, let’s cut all-1 columns out of it and make a recursive call. The corresponding recurrence relation is $C(n) \le an + C(n/2)$ implying $C(n)=O(n)$ .

Now, generalize it to the case of at most $d$ zeros in every row. Let $C_d(n)$ be the complexity of an $n \times (\le dn)$ matrix with at most $d$ zeros per row (if there are more than $dn$ columns, then some of them are all-1). Partition the columns into two parts $L$ and $R$ such that at least $n(1-2^{-d})$ rows (call them $T$ ) satisfy the following property: if there are exactly $d$ zeroes in a row, then not all of them belong to the same part (denote the remaining rows by $B$ ). Then make three recursive calls: $T \times L$ , $T \times R$ , and $B \times (L \cup R)$ . This gives a recurrence relation $C_d(n) \le an + 2\cdot C_{d-1}(n(1-2^{-d}))+C_d(2^{-d}n)$ . This, in turn, implies that $C_d(n) \le f(d)\cdot n$ . The function $f(d)$ is exponential, but still.

— Alexander S. Kulikov
source

A nice argument. But it seems to be tailor made for the case of d=2 zeros per row. What about d>2 zeros?

— Stasys

@Stasys, it is doable if I'm not mistaken. I've updated the answer.

— Alexander S. Kulikov