Les services financiers sont un grand utilisateur de Big Data et innovateur aussi. Un exemple est le commerce d'obligations hypothécaires. Pour répondre à vos questions:
Quel genre de données ces entreprises ont utilisé. Quelle était la taille des données?
- Longue histoire de chaque hypothèque émise au cours des dernières années et paiements mensuels à leur encontre. (Milliards de lignes)
- Longues histoires des antécédents de crédit. (Milliards de lignes)
- Indices des prix des logements. (Pas aussi gros)
Quels types de technologies d'outils ont-ils utilisés pour traiter les données?
Cela varie. Certains utilisent des solutions internes basées sur des bases de données comme Netezza ou Teradata. D'autres accèdent aux données via des systèmes fournis par les fournisseurs de données. (Corelogic, Experian, etc.) Certaines banques utilisent des technologies de bases de données en colonnes comme KDB ou 1010data.
Quel était le problème auquel ils étaient confrontés et comment la compréhension qu'ils avaient obtenue des données les avait aidés à résoudre le problème.
La question clé consiste à déterminer quand les obligations hypothécaires (titres adossés à des créances hypothécaires) seront remboursées par anticipation ou par défaut. Ceci est particulièrement important pour les obligations sans garantie gouvernementale. En fouillant dans les historiques de paiement, les dossiers de crédit et en comprenant la valeur actuelle de la maison, il est possible de prédire la probabilité d'un défaut. L'ajout d'un modèle de taux d'intérêt et d'un modèle de remboursement anticipé permet également de prédire la probabilité d'un remboursement anticipé.
Comment ils ont choisi l'outil \ technologie pour répondre à leurs besoins.
Si le projet est piloté par l'informatique interne, il est généralement basé sur un grand fournisseur de bases de données comme Oracle, Teradata ou Netezza. Si elle est motivée par les quants, ils sont plus susceptibles d'aller directement au fournisseur de données ou à un système «tout compris» tiers.
Quel type de modèle ils ont identifié à partir des données et quel type de modèle qu'ils recherchaient à partir des données.
La liaison des données donne un excellent aperçu de qui est susceptible de faire défaut sur ses prêts et de les rembourser par anticipation. Lorsque vous avez agrégé les prêts en obligations, cela peut être la différence entre une obligation émise à100 , 000 , 000 b e i n gw o r t h t h a t a m o u n t , o r a s l i t t l e a s20 000 000.