Du point de vue de la modélisation, la recherche d'informations est un domaine profond fondé sur plusieurs disciplines, notamment les statistiques, les mathématiques, la linguistique, l'intelligence artificielle et maintenant la science des données. En pratique, ces modèles sont appliqués contre du texte dans des corpus pour découvrir des modèles dans les données. Non seulement les modèles IR se chevauchent dans leur utilisation, ils peuvent "s'associer" avec d'autres modèles tels que les modèles k-means ou k-voisin le plus proche, puis d'autres modèles peuvent être appliqués du point de vue de la linguistique informatique comme LDA / LDI et modélisation du sujet Ensuite, le jeu final est une sorte de visualisation d'informations de cette découverte - après le classement, le regroupement et l'agrégation du travail. La recherche d'informations peut sembler être une discipline cryptique, mais un effort sérieux, qui est grandement apprécié, va ouvrir la zone pour une meilleure compréhension de chaque modèle et l'interaction entre les modèles. Je cite la série «Synthesis Lectures on Information Concepts, Retrieval, and Services» comme le meilleur endroit pour se plonger dans les fondements de l'IR.
Bien que je ne sépare pas entièrement l'IR et l'extraction d'informations, peut-être un sous-ensemble d'IE, l'extraction au niveau du concept, applique des modèles IR ainsi que des règles d'inférence basées sur l'IA pour extraire les ontologies associées. La nature graphique de ces relations est renforcée par la modélisation ontologique en OWL et RDF, et par les bases de données graphiques, qui permettent un ensemble moins strict ou rigoureux de modélisation des relations, et permettent plus de relations à la surface, plutôt que d'être contrôlées en soi. La capacité de développer de manière dynamique l'extraction d'informations conserve sa «discipline» très intéressante pour les chercheurs.
IR et IE jouent tous deux dans nos propres «entités du moment» importantes - certaines ont appelé des «ontologies dynamiques» - certaines étant Palantir - nous avons besoin des modèles, des modèles, des simulations et des visualisations de ces entités importantes pour faire des affaires dans face à la transformation de nouvelles sources d'information et à la modification des informations existantes. La modélisation conceptuelle, relationnelle, définitionnelle, modèle et ontologique doit être flexible et leurs visualisations les mêmes. La levée de poids des moteurs d'IA tels que Watson dans les domaines de l'extraction et de l'inférence d'informations a mis en lumière les champs IE et franchement IR. L'omniprésence du traitement du langage naturel et de l'apprentissage automatique attire également l'attention sur les modèles et moteurs IR et IE. L'impact des modèles IR sur la recherche et le référencement, ainsi que sur la modélisation Web sémantique en fait partie "