Voici ma table avec ~ 10 000 000 de données de lignes
CREATE TABLE `votes` (
`subject_name` varchar(32) COLLATE utf8_unicode_ci NOT NULL,
`subject_id` int(11) NOT NULL,
`voter_id` int(11) NOT NULL,
`rate` int(11) NOT NULL,
`updated_at` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
PRIMARY KEY (`subject_name`,`subject_id`,`voter_id`),
KEY `IDX_518B7ACFEBB4B8AD` (`voter_id`),
KEY `subject_timestamp` (`subject_name`,`subject_id`,`updated_at`),
KEY `voter_timestamp` (`voter_id`,`updated_at`),
CONSTRAINT `FK_518B7ACFEBB4B8AD` FOREIGN KEY (`voter_id`) REFERENCES `users` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;
Voici les index cardinalités
Donc, quand je fais cette requête:
SELECT SQL_NO_CACHE * FROM votes WHERE
voter_id = 1099 AND
rate = 1 AND
subject_name = 'medium'
ORDER BY updated_at DESC
LIMIT 20 OFFSET 100;
Je m'attendais à ce qu'il utilise index voter_timestamp
mais mysql choisit de l'utiliser à la place:
explain select SQL_NO_CACHE * from votes where subject_name = 'medium' and voter_id = 1001 and rate = 1 order by updated_at desc limit 20 offset 100;`
type:
index_merge
possible_keys:
PRIMARY,IDX_518B7ACFEBB4B8AD,subject_timestamp,voter_timestamp
key:
IDX_518B7ACFEBB4B8AD,PRIMARY
key_len:
102,98
ref:
NULL
rows:
9255
filtered:
10.00
Extra:
Using intersect(IDX_518B7ACFEBB4B8AD,PRIMARY); Using where; Using filesort
Et j'ai eu un temps de requête de 200 à 400 ms.
Si je le force à utiliser le bon index comme:
SELECT SQL_NO_CACHE * FROM votes USE INDEX (voter_timestamp) WHERE
voter_id = 1099 AND
rate = 1 AND
subject_name = 'medium'
ORDER BY updated_at DESC
LIMIT 20 OFFSET 100;
Mysql peut retourner les résultats en 1-2 ms
et voici l'expliquer:
type:
ref
possible_keys:
voter_timestamp
key:
voter_timestamp
key_len:
4
ref:
const
rows:
18714
filtered:
1.00
Extra:
Using where
Alors pourquoi mysql n'a-t-il pas choisi l' voter_timestamp
index pour ma requête d'origine?
Ce que j'avais essayé analyze table votes
, optimize table votes
c'est de supprimer cet index et de l'ajouter à nouveau, mais mysql utilise toujours le mauvais index. ne sais pas vraiment quel est le problème.
(voter_id, updated_at)
. Un autre indice serait (voter_id, subject_name, updated_at)
ou (subject_name, voter_id, updated_at)
(sans le taux).
subject_name='medium' and rate=1
)
LIMIT
ni même le ORDER BY
sauf si l'index satisfait d'abord tout le filtrage. Autrement dit, sans les 4 colonnes complètes, il collectera toutes les lignes pertinentes, les triera toutes, puis sélectionnera le LIMIT
. Avec l'index à 4 colonnes, la requête peut éviter le tri et s'arrêter après avoir lu uniquement les LIMIT
lignes.
subject_name = "medium"
pièce, elle peut également choisir le bon index, pas besoin d'indexerrate