Je travaille sur un logiciel qui devrait déterminer les emplacements du monde réel (par exemple, les radars) à partir de plusieurs rapports basés sur le GPS . Un utilisateur conduira lorsqu'il signalera un emplacement, ce qui rend les rapports très inexacts. Pour résoudre ce problème, je dois regrouper les rapports sur le même emplacement et calculer une moyenne.
Ma question est de savoir comment regrouper ces rapports . J'ai lu sur les algorithmes de maximisation des attentes et le clustering k-means , mais si j'ai bien compris, je devrais déterminer à l'avance le nombre d'emplacements réels.
Existe-t-il d'autres algorithmes, qui n'ont pas besoin du nombre exact d'emplacements réels, mais utilisent à la place des conditions de bord (par exemple une distance minimale)?
Un rapport contient la longitude , la latitude et la précision (en mètres). Il n'y a aucun nom ou autre qui pourrait être utilisé pour identifier les doublons.
Un autre obstacle pourrait être qu'il sera commun, qu'il n'y a qu'un seul rapport pour un emplacement réel. Il est donc difficile de distinguer les valeurs aberrantes des bonnes données.