Cómo predecir si un prestatario le pagará de vuelta
Por Seth Stephens-Davidowitz |
Science of Us
Recientemente, tres economistas -Oded Netzer y Alain Lemaire, ambos de Columbia, y Michal Herzenstein de la Universidad de Delaware- buscaron maneras de predecir la probabilidad de que un prestatario reembolsara un préstamo. Los estudiosos usaron datos de Prosper, un sitio de préstamos de igual a igual. Los posibles prestatarios escribir una breve descripción de por qué necesitan un préstamo y por qué es probable que hacer bien en él, y los prestamistas potenciales decidir si proporcionarles el dinero. En general, alrededor del 13 por ciento de los prestatarios incumplieron su préstamo.
Resulta que el lenguaje que los prestatarios potenciales utilizan es un fuerte predictor de su probabilidad de pagar. Y es un indicador importante, incluso si usted controla para otros prestamistas de información relevante fueron capaces de obtener acerca de los prestatarios potenciales, incluyendo calificaciones de crédito e ingresos.
A continuación se enumeran diez frases que los investigadores encontraron que se utilizan comúnmente al solicitar un préstamo. Cinco de ellos se correlacionan positivamente con el pago del préstamo. Cinco de ellos se correlacionan negativamente con el pago del préstamo. En otras palabras, cinco tienden a ser utilizados por personas en las que puedes confiar, cinco por personas que no puedes. Vea si puede adivinar cuáles son cuales.
Dios, promesa, libre de deudas, pago mínimo, tasa de interés más baja, pagará, graduado, gracias, después de impuestos, hospital.
Podría pensar -o al menos esperar- que una persona educada y abiertamente religiosa que da su palabra sería una de las que más probabilidades de pagar un préstamo. Pero de hecho este no es el caso. Este tipo de persona, los datos muestran, es menos probable que el promedio de hacer bien en su deuda.
Aquí están las frases utilizadas en las solicitudes de préstamo por las personas más propensas a pagarles: deuda libre, tasa de interés más baja, después de impuestos, pago mínimo, graduado.
Y aquí están las frases utilizadas por los menos propensos a pagar sus préstamos: Dios, la promesa, va a pagar, gracias, el hospital.
¿Qué debemos hacer de las palabras en las diferentes categorías? En primer lugar, vamos a considerar el lenguaje que sugiere que alguien es más probable que hacer sus pagos del préstamo. Frases como "tasa de interés más baja" o "después de impuestos" indican un cierto nivel de sofisticación financiera por parte del prestatario por lo que tal vez no es sorprendente que se correlacionan con alguien más propensos a pagar su préstamo. Además, si él o ella habla de logros positivos como ser un "graduado" universitario y ser "libre de deudas", él o ella también es probable que pague sus préstamos.
Ahora, consideremos un lenguaje que sugiere que es poco probable que alguien pague sus préstamos. Generalmente, si alguien le dice que le pagará, no le pagará. Cuanto más firme sea la promesa, más probable será que la rompa. Si alguien escribe "Prometo que pagaré, así que ayúdame Dios", él es uno de los que menos probabilidades de pagarle. Apelando a su misericordia -explicando que él necesita el dinero porque tiene un pariente en el "hospital" - también significa que es poco probable que le pague de vuelta. De hecho, mencionar a cualquier miembro de la familia -un marido, esposa, hijo, hija, madre o padre- es un signo que alguien no pagará. Otra palabra que indica el defecto es "explicar", es decir, si la gente está tratando de explicar por qué van a ser capaces de pagar un préstamo, es probable que no.
Los autores no tenían una teoría de por qué dar las gracias a la gente es la evidencia del incumplimiento probable.
En resumen, de acuerdo con estos investigadores, dando un plan detallado de cómo puede hacer sus pagos y mencionar los compromisos que ha mantenido en el pasado son la evidencia de que alguien pagará un préstamo. Hacer promesas y apelar a su misericordia es una señal clara de que alguien entrará en default. Independientemente de las razones -o de lo que nos dice acerca de la naturaleza humana- que hacer promesas es una señal segura de que alguien en realidad no hará algo -los eruditos encontraron que la prueba era una información extremadamente valiosa para predecir el incumplimiento. Alguien que menciona a Dios fue 2,2 veces más probabilidades de incumplimiento. Este fue uno de los indicadores más altos únicos que alguien no pagaría.
Pero los autores también creen que su estudio plantea cuestiones éticas. Mientras que esto era apenas un estudio académico, algunas compañías divulgan que utilizan datos en línea en aprobar préstamos. ¿Es esto aceptable? ¿Queremos vivir en un mundo en el que las empresas utilicen las palabras que escribimos para predecir si pagaremos un préstamo? Es, como mínimo, espeluznante y, posiblemente, aterrador.
Un consumidor que busca un préstamo en un futuro próximo podría no sólo tiene que preocuparse por su historia financiera, sino también su actividad en línea. Y puede ser juzgada por factores que parecen absurdos -ya sea que use la frase "Gracias" o invoca "Dios", por ejemplo. Además, ¿qué pasa con una mujer que legítimamente necesita para ayudar a su hermana en un hospital y sin duda volverá a pagar su préstamo después? Parece horrible castigarla porque, en promedio, las personas que dicen necesitar ayuda para las facturas médicas a menudo han demostrado estar mintiendo. Un mundo que funciona de esta manera comienza a parecer terriblemente distópico.
Big Data está explotando. Nos ha ayudado a encontrar los sitios web que queremos ver, las personas con las que queremos hablar, los trabajos que queremos solicitar.
Pero el poder de Big Data plantea una serie de preguntas éticas. En particular: ¿Las corporaciones tienen el derecho de juzgar nuestra aptitud para sus servicios basados en criterios abstractos pero estadísticamente predictivos que no están directamente relacionados con esos servicios?
Un mundo que funciona de esta manera comienza a parecer terriblemente distópico.
Un lugar donde nuestros datos digitales ya se utilizan cada vez más para tomar decisiones es en las prácticas de contratación. Los emprendimientos como TalentBin ayudan a las empresas a dar sentido a las redes sociales cuando consideran a los candidatos a puestos de trabajo. Eso no puede plantear cuestiones éticas si buscan evidencia de malas palabras de los empleadores anteriores o revelar los secretos de los empleadores anteriores. Pero, ¿y si encuentran un indicador aparentemente inofensivo que se correlaciona con algo que les importa?
Los investigadores de Cambridge y Microsoft dieron a 58.000 usuarios estadounidenses de Facebook una variedad de pruebas sobre su personalidad e inteligencia. Encontraron que los gustos de Facebook se correlacionan frecuentemente con IQ, extraversión, y conscientiousness. Por ejemplo, las personas que gustan de Mozart, las tormentas eléctricas y las patatas fritas rizadas en Facebook tienden a tener coeficientes de inteligencia más altos. Las personas que les gusta Harley Davidson motocicletas, el grupo de música country Lady Antebellum, o la página "I Love Being a Mom" tienden a tener un coeficiente intelectual más bajo. Algunas de estas correlaciones pueden deberse a la maldición de la dimensionalidad. Si pruebas suficientes cosas, algunas se correlacionan al azar. Sin embargo, algunos intereses pueden correlacionarse legítimamente con el CI.
No obstante, parecería injusto que una persona inteligente que le guste a Harley Davidsons no pudiera conseguir un trabajo acorde con sus habilidades porque era, sin darse cuenta, señalando una baja inteligencia.
Para ser justos, este no es un problema completamente nuevo. Las personas han sido juzgadas por factores no directamente relacionados con el desempeño en el trabajo: la firmeza de sus apretones de manos, la limpieza de su vestido. Pero un peligro de la revolución de datos es que, a medida que se cuantifica más de nuestra vida, estos juicios proxy pueden ser más esotéricos y más intrusivos. Una mejor predicción puede conducir a una discriminación más sutil y más nefasta.
Los mejores datos también pueden conducir a otra forma de discriminación, lo que los economistas llaman discriminación de precios. Las empresas a menudo están tratando de averiguar qué precio deben cobrar por bienes o servicios. Idealmente, quieren cobrar a los clientes lo máximo que están dispuestos a pagar.
La mayoría de las empresas generalmente terminan escogiendo un precio que todo el mundo paga. Pero a veces son conscientes de que los miembros de un determinado grupo, en promedio, pagan más. Esta es la razón por la que los cines cobran más a los clientes de mediana edad -a la altura de su poder adquisitivo- que a los estudiantes o personas de la tercera edad y por qué las aerolíneas suelen cobrar más a los compradores de última hora. El precio discrimina.
Big Data puede permitir que las empresas obtengan una mejora sustancial en el aprendizaje de lo que los clientes están dispuestos a pagar y, por lo tanto, agudizar a ciertos grupos de personas. Optimal Decisions Group fue pionera en el uso de la ciencia de datos para predecir cuánto están dispuestos a pagar los consumidores por los seguros. ¿Cómo lo hicieron? Ellos llevaron a cabo lo que se llama una búsqueda de doppelganger, encontrando a los clientes anteriores más similares a los que actualmente buscan comprar seguros - y vio lo alto que estaban dispuestos a asumir la prima. Una búsqueda de doppelganger es grande si nos ayuda a curar la enfermedad de alguien encontrando un pequeño grupo de pacientes más parecidos a él. Pero si una búsqueda de doppelganger ayuda a una corporación extraer cada centavo pasado de usted? Eso no es tan genial.
Los grandes casinos están utilizando algo así como una búsqueda de doppelganger para entender mejor a sus consumidores y asegurarse de que más de su dinero va a sus arcas. Así es como funciona. Cada jugador, los casinos creen, tiene un "punto de dolor." Esta es la cantidad de pérdidas que lo asustarán lo suficiente para que ella deja su casino por un período prolongado de tiempo. Supongamos, por ejemplo, que el "punto de dolor" de Helen es $ 3.000. Esto significa que si pierde $ 3,000, ha perdido un cliente, tal vez durante semanas o meses. Si Helen pierde $ 2,999, ella no estará feliz. ¿Quién, después de todo, le gusta perder dinero? Pero no estará tan desmoralizada que no vuelva mañana por la noche.
Imagine por un momento que está manejando un casino. E imagina que Helen se ha presentado para jugar las máquinas tragamonedas. ¿Cuál es el resultado óptimo? Claramente, usted quiere que Helen se acerque lo más posible a su "punto de dolor" sin cruzarlo. Quieres que pierda $ 2,999, lo suficiente como para hacer grandes ganancias, pero no tanto que no volverá a jugar de nuevo pronto.
¿Cómo puedes hacer esto? Bueno, hay maneras de hacer que Helen deje de jugar una vez que ha perdido una cierta cantidad. Usted puede ofrecer sus comidas gratis, por ejemplo. Hacer la oferta atractiva suficiente, y ella dejará las ranuras para la comida.
Pero hay un gran desafío con este enfoque. ¿Cómo sabes el "punto de dolor" de Helen? El problema es que la gente tiene diferentes "puntos de dolor". Para Helen, son $ 3,000. Para John, podría ser $ 2.000. Para Ben, podría ser $ 26,000. Si convence a Helen de dejar de apostar cuando perdió $ 2,000, dejó ganancias en la mesa. Si espera demasiado, después de haber perdido 3.000 dólares, la ha perdido durante un tiempo. Además, Helen podría no querer decirte su punto de dolor. Puede que ni siquiera sepa lo que es.
Usted utiliza la ciencia de los datos. Aprendes todo lo que puedas sobre una serie de clientes: su edad, género, código postal y comportamiento de juego. Y, a partir de ese comportamiento de juego, sus ganancias, pérdidas, idas y venidas, se estima su "punto de dolor". Recoja toda la información que conoce sobre Helen y encuentre jugadores que son similares a ella -su doppelgangers, más o menos. Sin embargo mucho dolor que pueden soportar es probablemente la misma cantidad que Helen. De hecho, esto es lo que hace el casino Harrah, utilizando una empresa de almacén Big Data, Terabyte, para ayudarles.
Scott Gnau, director general de Terabyte, explica, en el excelente libro Super Crunchers, lo que los administradores de casinos hacen cuando ven a un cliente regular acercarse a su punto de dolor: "Ellos salen y dicen: 'Veo que estás teniendo un día difícil. Sé que te gusta nuestro asador. Aquí, me gustaría que usted llevara a su esposa a cenar con nosotros en este momento. "En otras palabras, la administración está utilizando análisis de datos sofisticados para tratar de extraer tanto dinero de los clientes, a largo plazo, como puede.
Tenemos el derecho de temer que un mejor y mejor uso de los datos en línea dará a los casinos, compañías de seguros, prestamistas y otras entidades corporativas demasiado poder sobre nosotros. Por otra parte, Big Data también ha permitido a los consumidores marcar algunos golpes contra las empresas que los sobrecargar o entregar productos de mala calidad.
Un arma importante es sitios como Yelp que publican revisiones de restaurantes y otros servicios. Un estudio reciente del economista Michael Luca, de Harvard, ha demostrado hasta qué punto las empresas están a merced de las críticas de Yelp. Al comparar esas revisiones con los datos de ventas en el estado de Washington, descubrió que una estrella menos en Yelp hará que los ingresos de un restaurante disminuyan de cinco a nueve por ciento. Los consumidores también son ayudados en sus luchas con las empresas en comparación sitios de compras como Kayak y Booking.com.
Los datos en Internet, en otras palabras, pueden decir a las empresas que los clientes a evitar y que pueden explotar. También puede decir a los clientes las empresas que deben evitar y que está tratando de explotarlos. Big Data hasta la fecha ha ayudado a ambas partes en la lucha entre los consumidores y las corporaciones. Tenemos que asegurarnos de que siga siendo una pelea justa.