Pire nombre de questions nécessaires pour apprendre un prédicat monotone sur un poset

15

Considérons un poset fini sur éléments, et un prédicat monotone inconnu sur (c'est-à-dire pour tout , , si et alors ) . Je peux évaluer en fournissant un nœud et en déterminant si est vrai ou non. Mon objectif est de déterminer exactement l'ensemble des nœuds tel que valide, en utilisant aussi peu d'évaluations de $(X, \leq)$ $n$ $P$ $X$ $x$ $y \in X$ $P(x)$ $x \leq y$ $P(y)$ $P$ $x \in X$ $P(x)$ $x \in X$ $P(x)$ $P$ que possible. (Je peux choisir mes requêtes en fonction de la réponse à toutes les requêtes précédentes, je ne suis pas obligé de planifier toutes les requêtes à l'avance.)

Une stratégie sur est une fonction qui me dit, en fonction des requêtes que j'ai exécutées jusqu'ici et de leurs réponses, quel noeud interroger, et qui s'assure que sur tout prédicat , en suivant la stratégie , J'atteindrai un état dans lequel je connais la valeur de sur tous les nœuds. Le temps d'exécution de sur un prédicat est le nombre de requêtes nécessaires pour connaître la valeur de sur tous les nœuds. Le pire temps de fonctionnement de est . Une stratégie optimale est telle que . $S$ $(X, \leq)$ $P$ $P$ $r(S, P)$ $S$ $P$ $P$ $S$ $wr(S) = \max_P r(S, P)$ $S'$ $wr(S') = \min_S wr(S)$

Ma question est la suivante: étant donné en entrée le poset $(X, \leq)$ , comment puis-je déterminer le pire temps d'exécution des stratégies optimales?

[Il est clair que pour un poset vide, $n$ requêtes seront nécessaires (nous devons nous interroger sur chaque nœud), et que pour un ordre total autour de $\lceil \log_2 n \rceil$ requêtes seront nécessaires (faire une recherche binaire pour trouver la frontière). Un résultat plus général est la borne inférieure de la théorie de l'information suivante: le nombre de choix possibles pour le prédicat $P$ est le nombre $N_X$ d'antichaînes de $(X, \leq)$ (car il existe une correspondance biunivoque entre les prédicats monotones et antichaines interprétées comme les éléments maximaux de $P$ ), donc, puisque chaque requête nous donne un bit d'information, nous aurons besoin d'au moins $\lceil \log_2 N_X \rceil$ requêtes, en subsumant les deux cas précédents. Est-ce lié étroitement ou s'agit-il de posets dont la structure est telle que l'apprentissage peut nécessiter asymptotiquement plus de requêtes que le nombre d'antichaînes?]

— a3nm
source

2

En quoi est-ce différent de votre question précédente sur ce sujet? cstheory.stackexchange.com/questions/14772/…

— Suresh Venkat

1

D'accord, c'est similaire, mais je m'intéresse aux posets généraux ici, y compris les posets de petite largeur qui ne ressemblent pas du tout au réseau complet. En outre, je ne me soucie plus de la complexité incrémentale ou de quoi que ce soit du genre, juste au nombre de requêtes requises en fonction du choix du poset. Dans ce contexte, l'interprétation de la fonction booléenne n'est pas applicable et il semble vraiment que la réponse dépende en quelque sorte de la "structure" du poset (peut-être le nombre d'antichaînes, comme je l'ai suggéré). J'espère que cela mérite une question distincte, veuillez fermer si je me trompais.

— a3nm

1

Pour info, dans la littérature sur la complexité, les stratégies telles que vous les avez définies sont généralement appelées «arbres de décision» et elles ont une notion standard de hauteur (la mesure qui vous intéresse) et de taille.

— Joshua Grochow

Merci, Joshua! J'en suis plus ou moins conscient, je pensais juste qu'il était plus simple d'utiliser le vocabulaire de la théorie des jeux, mais oui, je suis conscient que la stratégie peut être vue comme un arbre.

— a3nm

1

(Pas de problème. Soit dit en passant, je ne faisais pas simplement remarquer qu'il peut être vu comme un arbre. La façon dont vous l'avez décrit est en effet très simple et claire, mais je vous fournissais un mot-clé / terme d'art que vous pourriez utiliser être capable de rechercher, en plus d'un terme qui est probablement immédiatement familier à de nombreuses personnes qui fréquentent ce site. À la vôtre!)

— Joshua Grochow

7

Ce n'est pas une réponse complète, mais c'est trop long pour être un commentaire.

Je pense avoir trouvé un exemple pour lequel la borne n'est pas serrée. $\lceil \log_2 N_X \rceil$

Considérez le poset suivant. L'ensemble de base est , et est plus petit que pour tout . Les autres paires sont incomparables. (Le diagramme de Hasse est un cycle de ). $X=\{a_1, a_2, b_1, b_2\}$ $a_i$ $b_j$ $i,j\in\{1,2\}$ $4$

Permettez-moi d'identifier les propriétés monotones avec les bouleversements du poset. Ce poset a sept bouleversements: , , , , , , $\emptyset$ $\{b_1\}$ $\{b_2\}$ $\{b_1,b_2\}$ $\{a_1,b_1,b_2\}$ $\{a_2,b_1,b_2\}$ , et ce poset a sept antichaines puisque les antichaines sont en correspondance biunivoque avec les bouleversements. Donc, pour ce poset. $\{a_1,a_2,b_1,b_2\}$ $\lceil \log_2 N_X \rceil=\lceil \log_2 7 \rceil = 3$

Maintenant, par l'argument de l'adversaire, je montrerai que toute stratégie nécessite au moins quatre requêtes (donc doit interroger tous les éléments). Corrigeons une stratégie arbitraire.

Si la stratégie demande d'abord , l'adversaire répond " ne tient pas". Il nous reste alors cinq possibilités: , , , , . Ainsi, pour déterminer quel est le cas, il nous faut au moins $a_1$ $P(a_1)$ $\emptyset$ $\{b_1\}$ $\{b_2\}$ $\{b_1,b_2\}$ $\{a_2,b_1,b_2\}$ $\lceil \log_2 5\rceil = 3$ plus de requêtes. Au total, nous avons besoin de quatre requêtes. Le même argument s'applique si la première requête est . $a_2$

Si la stratégie interroge d'abord , l'adversaire répond " tient". Il nous reste alors cinq possibilités: , , , , $b_1$ $P(b_1)$ $\{b_1\}$ $\{b_1,b_2\}$ $\{a_1,b_1,b_2\}$ $\{a_2,b_1,b_2\}$ . Par conséquent, nous avons besoin d'au moins trois requêtes supplémentaires comme auparavant. Au total, nous avons besoin de quatre requêtes. Le même argument s'applique lorsque la première requête est . $\{a_1,a_2,b_1,b_2\}$ $b_2$

Si nous prenons copies parallèles de ce poset, alors il a antichaines, et donc la borne proposée est . Mais, comme chacune des copies nécessite quatre requêtes, nous avons besoin d'au moins requêtes. $k$ $7^k$ $\lceil \log_2 7^k \rceil = 3k$ $4k$

Probablement, il y a un plus grand poset avec un plus grand écart. Mais cet argument ne peut qu'améliorer le coefficient.

Ici, le problème semble être une situation où aucune requête ne partitionne l'espace de recherche de manière égale. Dans un tel cas, l'adversaire peut forcer la plus grande moitié à rester.

— Yoshio Okamoto
source

1

Ah, intéressant. En généralisant votre exemple

, il est clair que si la réponse est

et

alors nous ne le saurons pas avec certitude jusqu'à ce que les

nœuds soient interrogés. Cependant, il y a

X = {a_{1}, . . ., a_{n}, b_{1}, . . ., b_{n}}

$X = \{a_1, ..., a_n, b_1, ..., b_n\}$

\forall i, \neg P (a_{i})

$\forall i, \neg P(a_i)$

\forall i, P (b_{i})

$\forall i, P(b_i)$

2 n

$2n$

antichains (

sous-ensembles non vides de

, idem pour

et l'ensemble vide), donc la limite n'est pas serrée d'un facteur 2. Merci pour cet exemple. Cependant, je ne vois pas vraiment comment / si l'écart pourrait être plus qu'un facteur multiplicatif, ou si une limite supérieure non triviale peut être trouvée, sans parler d'un algorithme pour une réponse exacte.

2^{n + 1} - 1

$2^{n+1} - 1$

2^{n} - 1

$2^n-1$

a_{i}

$a_i$

b_{i}

$b_i$

— a3nm

7

Dans leur article Every Poset Has a Central Element , Linial et Saks montrent (Théorème 1) que le nombre de requêtes nécessaires pour résoudre le problème d'identification idéal dans un poset est au plus , où et est le nombre d'idéaux de . Ce qu'ils appellent un "idéal" est en fait un ensemble inférieur $X$ $K_0 \log_2 i(X)$ $K_0 = 1/(2 - \log_2(1 + \log_2 5))$ $i(X)$ $X$ et il y a une correspondance évidente entre les prédicats monotones et l'ensemble inférieur des points sur lesquels ils ne tiennent pas, outre leur "problème d'identification" est d'identifier en interrogeant les nœuds comme dans mon contexte, donc je pense qu'ils sont traiter le problème que je suis intéressé et que . $i(X) = N_X$

Ainsi, selon leur résultat, la borne inférieure théorique de l'information est serrée jusqu'à une constante multiplicative relativement petite. Donc , ce règle essentiellement la question du nombre de questions posées, en fonction de et jusqu'à une constante multiplicatif: il est entre et . $N_X$ $\log_2 N_X$ $K_0 \log_2 N_X$

Linial et Saks citent une communication personnelle de Shearer pour dire qu'il existe des ordres connus pour lesquels nous pouvons prouver une borne inférieure de pour certains qui est juste légèrement inférieure à (c'est dans l'esprit de Réponse de Yoshio Okamoto qui a essayé cette approche pour une valeur plus petite de ). $K_1 \log_2 N_X$ $K_1$ $K_0$ $K_1$

Cela ne répond pas entièrement à ma question de calculer le nombre de questions requises de , cependant, puisque le calcul de partir de est # P-complet , j'ai le sentiment qu'il y a peu d'espoir. (Les commentaires sur ce point sont les bienvenus.) Pourtant, ce résultat de Linial et Saks est instructif. $X$ $N_X$ $X$

— a3nm
source

5

Pour le n-cube booléen (ou, de manière équivalente, pour le poset de tous les sous-ensembles d'un ensemble de n éléments), la réponse est donnée par les théorèmes de Korobkov et Hansel (respectivement de 1963 et 1966). Le théorème de Hansel [1] déclare qu'une fonction booléenne monotone inconnue (c'est-à-dire un prédicat monotone inconnu sur ce poset) peut être apprise par un algorithme déterministe faisant au plus $(\{0, 1\}^n, \leq)$ $(2^S, \subseteq)$ requêtes (qui est, demanderquestions dans le pirecas). Cet algorithme correspond à la borne inférieure du théorème de Korobkov [2], qui dit que lesrequêtesne suffisent pas. (L'algorithme de Hansel est donc optimal dans le pire des cas.) Un algorithme dans les deux déclarations est considéré comme un arbre de décision déterministe. $\phi(n) = \binom{n}{\lfloor n/2 \rfloor} + \binom{n}{\lfloor n/2 \rfloor + 1}$ $\phi(n)$ $\phi(n) - 1$

Le logarithme du nombre d'antichaînes dans est asymptotiquement égal à $(\{0, 1\}^n, \le)$ , il existe donc un écart de facteur constant entreet les performances optimales de l'algorithme $\binom{n}{\lfloor n/2 \rfloor} \sim 2^n / \sqrt{\pi n / 2}$ $\log N_X$ pour ce poset. $\phi(n) \sim 2 \binom{n}{\lfloor n/2 \rfloor}$

Malheureusement, je n'ai pas pu trouver un bon traitement de l'algorithme de Hansel en anglais disponible sur le web. Il est basé sur un lemme qui partitionne le n-cube en chaînes avec des propriétés spéciales. Une description peut être trouvée dans [3]. Pour la borne inférieure, je ne connais aucune référence à une description en anglais. $\phi(n)$

Étant donné que je connais ces résultats, je peux publier une description sur arXiv, si le traitement dans l'article de Kovalerchuk ne suffit pas.

Si je ne me trompe pas beaucoup, il y a eu des tentatives pour généraliser l'approche de Hansel, au moins au poset , où est une chaîne , bien que je ne peut donner aucune référence immédiatement. Pour le cas booléen, les gens ont également étudié des notions de complexité autres que le pire des cas pour ce problème. $(E_k^n, \le)$ $(E_k, \le)$ $0 < 1 < \ldots < k - 1$

[1] G. Hansel, Sur le nombre de fonctions booléennes monotones de n variables. CR Acad. Sci. Paris, 262 (20), 1088-1090 (1966)

[2] VK Korobkov. Estimation du nombre de fonctions monotones de l'algèbre de la logique et de la complexité de l'algorithme de recherche de l'ensemble résolu pour une fonction monotone arbitraire de l'algèbre de la logique. Mathématiques soviétiques. Doklady 4, 753-756 (1963) (traduction du russe)

[3] B. Kovalerchuk, E. Triantaphyllou, AS Deshpande, E. Vityaev. Apprentissage interactif des fonctions booléennes monotones. Sciences de l'information 94 (1), 87-118 (1996) ( lien )

— dd1
source

Merci beaucoup pour cette réponse détaillée! Pour le cube

booléen, voir < cstheory.stackexchange.com/q/14772 >. Je peux lire le français mais je n'ai pas trouvé l'article de Hansel (aurait dû être disponible sur Gallica mais ce problème semble manquer), j'ai trouvé des informations pertinentes dans Sokolov, NA (1982), "On the Optimal Evaluation of Monotonic Boolean Functions", USSR Comput Math Math Phys, Vol 22, No 2, 207-220 (une traduction en anglais existe). Je suis intéressé par les généralisations à d'autres DAG si vous pouvez trouver des références. N'hésitez pas à répondre par email (a3nm AT a3nm DOT net) si la limite de longueur est un problème. Merci encore!

n

$n$

— a3nm

Je vous en prie! Malheureusement, je ne sais pas comment limiter le temps d'exécution de l'algorithme en termes de taille de sortie. La preuve de Korobkov de la borne inférieure, par exemple, ne répond pas à cette question. Cependant, je pense qu'il peut y avoir une référence qui est légèrement pertinente. J'essaierai de trouver du temps au cours du week-end et de rechercher également des généralisations. En même temps, je ne sais pas si une description fermée en anglais du cas booléen (ces deux théorèmes) mérite d'être écrite ...

— dd1

@ a3nm le cas DAG n'a peut-être pas été pris en compte dans la littérature? pourrait-il être plus difficile que le n-cube booléen ordonné par inclusion?

— vzn

@vzn Je suppose qu'au moins certaines des questions ici ne manqueront pas d'être ouvertes. Même pour une chaîne, il n'est pas immédiatement clair comment généraliser l'algorithme de Hansel.

— dd1

@ a3nm, tout semble similaire à la recherche de bornes inférieures / circuits monotones minimaux (tailles), mais je ne l'ai pas vu clairement lié jusqu'à présent ...

— vzn

0

[ REMARQUE: L'argument suivant ne semble pas fonctionner, mais je le laisse ici pour que les autres ne commettent pas la même erreur / au cas où quelqu'un pourrait le réparer. Le problème est qu'une limite inférieure exponentielle sur l'apprentissage / l'identification d'une fonction monotone, comme ci-dessous, ne contredit pas nécessairement un algorithme polynomial incrémentiel pour le problème. Et c'est ce dernier qui équivaut à vérifier la dualité mutuelle de deux fonctions monotones en temps poly.]

Je crois que votre conjecture sur le est fausse en général. S'il est vrai que requêtes sont nécessaires, cela implique une borne inférieure assez forte pour l' apprentissage des fonctions monotones à l'aide de requêtes d'appartenance . En particulier, que le poset soit le cube Boolean à la commande habituelle (si vous voulez, est le powerset de avec comme ordre partiel). Le nombre d'antichaînes maximales dans satisfait $\log N_X$ $\log N_X$ $X$ $X$ $\{1,...,n\}$ $\subseteq$ $M$ $X$ [1]. Si votre idée sur leest correcte, alors il existe un prédicat monotone surqui nécessite essentiellement $\log M = (1 + o(1))\binom{n-1}{\lfloor n/2 \rfloor}$ $\log N_X$ $X$ requêtes. En particulier, cela implique une borne inférieure essentiellement depour la complexité de tout algorithme résolvant ce problème. $\binom{n-1}{n/2} \approx 2^n$ $2^n$

However, if I've understood correctly [which I now know I hadn't], your problem is equivalent to checking the mutual duality of two monotone functions, which can be done in quasi-polynomial time (see the intro of this paper by Bioch and Ibaraki, which cites Fredman and Khachiyan), contradicting anything close to a $2^n$ lower bound.

[1] Liviu Ilinca and Jeff Kahn. Counting maximal antichains and independent sets. arXiv:1202.4427

— Joshua Grochow
source

Josh, I don't see a problem with the

\log N_{X}

$\log N_X$ argument. my understanding is that it is open whether a monotone function can be learned in time polynomial in

n

$n$ and the number of minimal elements. the Bioch-Ibaraki paper is about incrementally polynomial algorithm

— Sasho Nikolov

Ah, okay. I wasn't aware of that. (Like I said, I'm not an expert in this area - my answer was just based on looking up a few things and putting them together.) I'll leave it here so other people can see it and at least not make the same mistake / at best turn it into something useful.

— Joshua Grochow