Volver al blog
MetodologíaIAProducto

La metodología de scoring de BrickToro: cómo puntuamos 50.000 propiedades

Hay dos formas de hacer un score de oportunidad inmobiliaria: un modelo opaco que escupe un número, o un pipeline transparente donde cada componente sea explicable. Hemos elegido la segunda. Esta es la receta exacta.

Equipo BrickToro
9 min de lectura

El problema con los scores opacos

La mayoría de plataformas que prometen "IA inmobiliaria" devuelven una puntuación sin explicar de dónde sale. Esto tiene un problema obvio: si el inversor no entiende por qué un piso saca 87 y otro 62, no puede confiar en el resultado para tomar una decisión de seis cifras.

Cuando rediseñamos el scoring de BrickToro decidimos exactamente lo contrario: un pipeline transparente donde cada subscore es auditable y donde el resultado final se descompone en factores explicables. Si una propiedad saca 92, queremos poder responder "94 puntos por descuento del 22 % vs €/m² de zona, 78 por rentabilidad de alquiler estimada, 95 por bandera de cambio de uso clara, 88 por estado del edificio". Sin caja negra.

Pipeline en dos capas

El sistema está dividido en dos capas que se ejecutan secuencialmente sobre cada propiedad nueva:

Capa 1: scoring determinista

Un conjunto de reglas matemáticas y heurísticas que se aplica a cada propiedad. Inputs: precio, superficie, ubicación (código postal y municipio), tipo de inmueble, fecha de publicación, descripción cruda. Outputs: subscores en cada estrategia (alquiler tradicional, flipping, coliving, cambio de uso), descuento vs mercado, banderas básicas, score determinista 0-100.

Esta capa es rápida (decenas de milisegundos por propiedad) y reproducible. Si la ejecutas dos veces sobre la misma entrada, da el mismo resultado.

Capa 2: enriquecimiento LLM

Solo se ejecuta sobre el top-N de propiedades que han pasado el filtro determinista. Un modelo de lenguaje analiza la descripción completa y devuelve siete banderas semánticas: cambio de uso, división horizontal, problema de posesión, turístico, compra de deuda, proindiviso y oportunidad real. También extrae estado declarado del inmueble, situación arrendaticia y otros datos que solo aparecen en lenguaje natural.

Las banderas LLM se cruzan con el score determinista para producir el score final. Es decir: una propiedad con score determinista 78 puede subir a 92 si la capa LLM detecta una bandera fuerte de cambio de uso, y bajar a 60 si detecta un problema de posesión.

Estrategias paralelas, no un score único

Una misma propiedad puede ser excelente para flipping y mediocre para alquiler. Por eso no calculamos un único número universal: calculamos un score independiente para cada estrategia y dejamos al usuario filtrar por la que le interesa.

  • Piso de inversión (buy & hold): rentabilidad de alquiler estimada vs precio. Costes incluidos: ITP 8 %, notaría 3.000 €, comisión venta 3 %, reforma 600 €/m².
  • Flipping: descuento real vs €/m² de zona y margen tras reforma y venta. Costes incluidos: ITP 8 %, notaría, reforma 600-900 €/m², comisión venta 3 %.
  • Coliving: rentabilidad por habitación, calculada sobre el precio medio de habitación del código postal. Asume 15 m² por habitación, máximo 8, ocupación 90 %.
  • Cambio de uso: sólo se aplica a locales y oficinas. Costes incluidos: ITP, proyecto técnico, reforma 1.800 €/m², licencia, comisión venta. Margen mínimo del 10 %.

Cómo se calcula el descuento vs mercado

Para cada propiedad calculamos un precio de mercado de referencia multiplicando su superficie por el €/m² medio de venta de su código postal. Ese €/m² medio se obtiene de la mediana de los anuncios activos en los últimos 90 días en ese mismo código postal y categoría tipológica.

Por qué la mediana y no la media: la mediana resiste mejor los outliers. Un anuncio cargado a 8.000 €/m² en una zona donde se mueve a 2.500 €/m² distorsiona la media pero apenas afecta a la mediana. Y los outliers son frecuentes en datos de portales: anuncios mal etiquetados, precios negociados a la baja sin actualizar, segmentos premium dentro de barrios estándar.

Banderas IA: qué detectamos en la descripción

Las siete banderas que devuelve la capa LLM son intencionalmente categóricas (sí/no/incierto) y vinculadas a una cita textual del anuncio:

  1. Cambio de uso. El anuncio menciona explícita o indirectamente potencial de transformar el inmueble en otro uso urbanístico.
  2. División horizontal. Posibilidad de dividir el inmueble en varias unidades registrales independientes.
  3. Problema de posesión. El inmueble está ocupado, en proceso judicial de desahucio o con inquilinos en renta antigua.
  4. Turístico. Tiene o puede tener licencia de vivienda de uso turístico.
  5. Compra de deuda. El anuncio se vende como compra de deuda hipotecaria o inmueble en proceso de ejecución.
  6. Proindiviso. Solo se vende una cuota o porcentaje, no la propiedad completa.
  7. Oportunidad real. Marker compuesto: precio claramente por debajo de mercado y descripción coherente con un motivo de venta urgente.

Cada bandera puede penalizar o bonificar el score final según la estrategia. Una bandera de "problema de posesión" baja el score de buy & hold pero puede subir el de flipping si el descuento de precio compensa el coste y el plazo de desocupación.

Refresh y materialización

El score se recalcula cada 20 minutos en una vista materializada. Esto significa que el sistema no recalcula sobre la marcha cada vez que un usuario abre el listado: lee de una tabla precalculada que se reconstruye en segundo plano. La vista usa RENAME TABLE para hacer zero-downtime: la nueva versión se construye en una tabla auxiliar y se renombra atómicamente cuando está lista.

Después de cada refresh precaculamos en Redis las consultas más comunes (las cinco pestañas IA principales) para que el primer usuario después del refresh no espere más de 100 ms.

Por qué publicamos esto

Porque la transparencia es un argumento comercial y a la vez un compromiso de calidad. Si publicamos la receta, asumimos públicamente la responsabilidad de mantenerla coherente. El scoring de BrickToro no es magia ni IA mística: es un pipeline cuidadosamente diseñado donde cada decisión de diseño es defendible por separado. Y eso es justo lo que un inversor debería exigir antes de basar una decisión de seis cifras en un número que devuelve un programa.

Aplica esto a propiedades reales

Más de 50.000 anuncios de Idealista y Fotocasa analizados con la metodología que describimos en este post.