E075_Conecté Claude con NotebookLM (Contexto Infinito Sin Gastar Tokens)
Ep. 75

E075_Conecté Claude con NotebookLM (Contexto Infinito Sin Gastar Tokens)

Episode description

Descubre el Poder de la Fusión de Cloud y Notebook LM

La inteligencia artificial puede ser una herramienta revolucionaria, pero también puede generar un gasto excesivo si no se utiliza de manera eficiente. En este episodio, exploramos cómo fusionar Cloud y Notebook LM sin arruinarte en tokens, gracias a la herramienta gratuita de Google que actúa como un escudo contra la “amnesia” de los modelos de lenguaje. Aprende a construir un segundo cerebro automatizado que recuerda todos los proyectos de un negocio y descubre cómo ahorrar tokens de manera efectiva.

Download transcript (.srt)
0:09

Buenas, esto es BIMPRAXIS, el podcast donde el

0:15

BIM se encuentra con la inteligencia artificial.

0:20

Exploramos la ciencia, la tecnología y el futuro

0:23

desde el enfoque de la arquitectura, ingeniería y

0:26

construcción.

0:28

¡Empezamos!

0:36

Muy buenas, bienvenidas, bienvenidos a un nuevo episodio

0:40

de BIMPRAXIS.

0:41

Hoy os traemos el cerebro infinito, cómo fusionar

0:44

Cloud y Notebook LM sin arruinarte en tokens.

0:48

Y, de verdad, que este es uno de

0:50

esos temas que cambian por completo las reglas

0:52

del juego.

0:53

Totalmente.

0:54

A ver, para arrancar, la misión de hoy

0:56

es sumergirnos en un escenario que parece, no

0:59

sé, de ciencia ficción, pero que está pasando

1:01

ahora mismo.

1:02

Sí, sí.

1:02

Hay empresas tecnológicas, agencias creativas, que están quemando

1:06

cientos o incluso miles de euros a la

1:08

semana, única y exclusivamente para que una inteligencia

1:11

artificial vuelva a leer los mismos documentos que,

1:14

bueno, ya se leyó el día anterior.

1:16

Es una locura.

1:17

Es una fuga de capital absurda.

1:20

Una barbaridad.

1:21

Y todo provocado por un problema técnico de

1:23

base.

1:24

Pero hoy tenemos sobre la mesa fuentes buenísimas,

1:26

¿eh?

1:27

Análisis súper minuciosos de canales como Luciano Cutipa

1:30

y Claridad Artificial.

1:31

Ajá.

1:32

Creadores que realmente rascan bajo la superficie.

1:35

Eso es.

1:36

Y nos exponen precisamente cómo tapar esta fuga.

1:39

Vamos a desgranar cómo construir, digamos, un segundo

1:42

cerebro automatizado que recuerda todos los proyectos de

1:45

un negocio.

1:46

Exacto.

1:46

Exacto.

1:52

Porque, a ver, el núcleo de esta fuga

1:56

de capital de la que hablas reside en

1:58

lo que mucha gente llama la amnesia de

2:01

los modelos de lenguaje.

2:03

La famosa amnesia, claro.

2:04

Eso es.

2:05

Para comprender la magnitud de la solución que

2:07

plantean estas fuentes, primero hay que entender esta

2:10

limitación técnica de sistemas como Cloud.

2:13

O sea, no es que carezcan de memoria

2:15

por un error de programación.

2:17

Ya.

2:17

No es un fallo, ¿no?

2:18

Que va.

2:19

No es un bug.

2:19

Es por una restricción severa en la infraestructura

2:22

de los servidores.

2:24

Mantener el contexto de una conversación activa de

2:26

forma permanente para millones de usuarios, bueno, requeriría

2:30

una capacidad de procesamiento que hoy por hoy

2:32

es inviable económicamente.

2:34

Es carísimo.

2:35

Claro.

2:36

Por tanto, el diseño estándar dicta que cada

2:39

vez que abres una nueva ventana de chat,

2:41

el modelo arranca completamente en blanco.

2:44

Vale.

2:45

Vamos a desgranar esto con una analogía porque

2:47

creo que… Ya se ve clarísimo.

2:48

Es como tener al becario más brillante del

2:51

mundo.

2:51

Un prodigio.

2:52

Un prodigio, pero con memoria de pez.

2:54

Total.

2:55

Memoria de Dory.

2:56

Exacto.

2:56

Cada mañana tienes que obligarle a leerse un

2:59

manual de 500 páginas antes de que te

3:01

pueda responder a un simple correo.

3:02

Y claro, el problema viene con la factura.

3:05

Claro, porque te cobra por la hora entera

3:07

de lectura.

3:08

Cobra por el tiempo que invierte en leer

3:10

esas 500 páginas antes de empezar a redactar.

3:13

Lo fascinante de esto es que el modelo

3:16

de facturación… Funciona mediante tokens.

3:19

Que a grandes rasgos son fragmentos de palabras.

3:23

Sí, como las sílabas de la IA, digamos.

3:26

Efectivamente.

3:27

Cuando tú cargas un documento gigante para dar

3:30

contexto, el sistema no hace una lectura rápida

3:33

por encima.

3:33

Hace cálculos matemáticos complejísimos para cada uno de

3:37

esos tokens.

3:38

Madre mía.

3:39

Establece relaciones semánticas.

3:41

Entonces, si le inyectas 100 páginas de historial

3:44

en cada conversación para evitar esa amnesia… Fuerzas

3:48

a los servidores a recalcular todo desde cero.

3:51

Y eso chupa tokens que da gusto.

3:53

Te satura el sistema y se dispara la

3:55

factura.

3:56

Una consulta que debería costar céntimos te sale

3:59

por un pico, solo por el peaje del

4:01

contexto.

4:02

Y claro, con esta dinámica, cualquier intento de

4:05

crear un asistente integrado de verdad en una

4:07

empresa se va a pique.

4:08

Es inviable.

4:10

Totalmente inviable.

4:11

Entonces, si alimentar a Cloud directamente es un

4:14

pozo sin fondo, la estrategia tiene que ser

4:17

cambiada.

4:18

Y aquí entra Notebook LM.

4:21

La herramienta gratuita de Google, exacto.

4:23

Eso es.

4:24

Que nuestras fuentes la presentan no como un

4:27

sustituto de Cloud, sino como un escudo, ¿no?

4:30

Una barrera de contención.

4:32

Claro, el cambio de paradigma ocurre por la

4:34

persistencia.

4:36

Notebook LM guarda la información, el contexto, las

4:39

decisiones pasadas, en libretas o cuadernos.

4:42

Que no se borran al cerrar la pestaña.

4:44

Exactamente.

4:45

Entonces, Notebook LM actúa como interpretador.

4:47

Es un intermediario entre tu base de datos

4:49

y el motor de razonamiento de Cloud.

4:51

Y para hacer esto, usa lo que se

4:53

llama un sistema RAG.

4:55

Vale.

4:55

RAG, Generación Aumentada por Recuperación.

4:58

A ver, detengámonos aquí, porque suena a tecnicismo

5:01

duro de ingeniería, pero entiendo que es la

5:04

magia que evita que nos arruinemos.

5:06

Es la clave de todo, sí.

5:08

¿Cómo funciona esta recuperación en la práctica?

5:11

Pues mira, en lugar de leerse el texto

5:13

entero como haríamos nosotros, un sistema RAG convierte,

5:17

las palabras e información, en coordenadas matemáticas, los

5:20

famosos embeddings.

5:22

Vale, lo traduce a números.

5:23

Eso es.

5:24

Y cuando tú lanzas una pregunta, el sistema

5:26

traduce tu pregunta también a coordenadas y busca,

5:29

en ese espacio matemático, qué fragmentos del texto

5:31

están más cerca de tu duda.

5:33

Ah, qué bueno.

5:34

Entonces, Notebook LM no coge el documento de

5:37

100 páginas y se lo manda a Cloud.

5:39

Simplemente agarra los tres o cuatro párrafos precisos

5:41

que tienen la respuesta, hace un resumen hiperfocalizado

5:44

y le manda solo esa píldora.

5:46

O sea, en lugar de obligar al becario

5:48

a leerse la enciclopedia entera cada vez que

5:50

le preguntas por París, este sistema actúa como

5:53

un bibliotecario, que fotocopia solo la página de

5:56

París, se la da al becario y le

5:58

dice que trabaje solo con eso.

6:00

Exacto.

6:00

El ahorro de tokens ahí es brutal.

6:02

Brutal, claro.

6:03

Pero espera, porque aquí me surge una duda.

6:06

He visto un montón de creadores de contenido

6:08

presumiendo de conectar Cloud con Obsidian para hacer

6:11

su famoso segundo cerebro usando formato Markdown y

6:14

tal.

6:14

Sí, está súper de moda.

6:16

Ya, pero ¿no es exactamente lo mismo?

6:19

Porque a simple vista el objetivo es idéntico.

6:21

¿Por qué nuestras fuentes descartan esa ruta de

6:23

Obsidian?

6:24

A ver, visualmente, y para organizarte tú, Obsidian

6:27

es una pasada.

6:28

Pero la trampa está en la arquitectura de

6:31

la conexión.

6:32

Vale.

6:32

Cuando conectas Obsidian directo con Cloud, como Obsidian

6:36

es una red de nodos interconectados, la tendencia

6:39

es enviar el flujo de información completo.

6:42

¡Ostras!

6:43

Claro.

6:46

Para que Cloud entiende el contexto, vuelve a

6:49

inyectar toda la biblioteca de golpe.

6:51

Y te vuelve a fulminar los tokens.

6:52

Te los fulmina.

6:53

Dispara el consumo y el gasto por el

6:55

mismo resultado.

6:56

En cambio, Notebook LM, como tiene el sistema

6:59

RAC nativo de Google súper optimizado, es muchísimo

7:03

más eficiente filtrando.

7:04

Entendido.

7:05

Vale, solucionado el problema del dinero con este

7:08

bibliotecario digital.

7:09

Ahora, pasar de la teoría a la práctica.

7:12

Vamos a lo interesante.

7:13

Sí.

7:13

¿Por qué?

7:14

Porque tener esto bien organizado no sirve sino

7:16

para… No produce trabajo real.

7:17

Y los casos de uso que explican en

7:19

estos análisis van mucho más allá de, no

7:21

sé, resumir un PDF.

7:23

Aquí entramos en la clonación del conocimiento.

7:25

Aquí es donde la cosa se pone realmente

7:27

interesante.

7:28

Por ejemplo, el enriquecimiento de canales.

7:31

Imagina un canal de YouTube, ¿vale?

7:33

Vale.

7:34

Subes el enlace a Notebook LM para que

7:36

absorba todo.

7:37

El estilo, las temáticas, el tono.

7:40

Y Cloud te genera una estrategia de marketing

7:42

perfecta.

7:43

Es que pasa de ser un bot genérico

7:45

a ser… A ser tu director de estrategia.

7:48

Y algo que me encanta que dicen los

7:49

análisis es que te dice qué duplicar basándose

7:52

en datos fríos.

7:53

O sea, si a ti como creador te

7:55

duele en el alma grabar shorts, pero la

7:57

llave, que es lo que funciona, te va

7:58

a decir que hagas shorts.

7:59

No tiene piedad.

8:00

Claro, no tiene sesgos emocionales.

8:02

Ninguno.

8:04

Pero el salto más loco es el aprendizaje

8:06

acelerado, el clon.

8:07

Uf, ese caso es tremendo.

8:09

Imagina que en tu empresa no tenéis ni

8:10

idea de cómo hacer una landing page atractiva.

8:13

Ni idea.

8:14

Cero.

8:14

Cero.

8:15

Entonces, en vez de pasarte semanas viendo tutoriales,

8:17

le dices a Notebook LM que busque por

8:20

toda la web a expertos, blogs, vídeos… Y

8:24

te crea un cuaderno experto en segundos.

8:27

En segundos.

8:28

Y luego conectas a Cloud ahí.

8:30

Exacto.

8:31

Cloud lee eso y te programa la página

8:33

automáticamente.

8:34

Te saltas toda la curva de aprendizaje.

8:37

Madre mía.

8:37

Y no solo para programar.

8:39

El canal Claridad Artificial pone un ejemplo de

8:42

investigación profunda que te vuela la cabeza.

8:44

Sí.

8:45

La privacidad, ¿no?

8:46

Ese.

8:46

Cogen un tema súper denso, como la regulación

8:49

de la inteligencia artificial, y Notebook LM procesa

8:53

hasta 396 fuentes distintas.

8:56

396 fuentes.

8:58

A la vez.

8:58

Informes legales, artículos académicos… Y los sintetiza sin

9:02

gastar ni un solo token de Cloud.

9:04

Y lo bueno es que el resultado no

9:05

es un texto ahí plano y aburrido.

9:07

Claro.

9:08

Te hace formatos visuales.

9:09

Te genera infografías, te monta presentaciones animadas.

9:13

Incluso puede generarte un debate de audio, un

9:16

podcast, donde dos voces analizan los documentos.

9:18

Es una locura.

9:19

Pero fíjate, para empresas el ejemplo definitivo que

9:22

analizan es el de la agencia inmobiliaria.

9:24

Ah, la generación de webs internas.

9:26

Buenísimo.

9:27

Es fundamental para entender el valor de retener

9:29

el contexto.

9:30

En una inmobiliaria el pan de cada día

9:32

es manejar objeciones de clientes.

9:33

Que si el precio, que si el barrio…

9:36

Y ese conocimiento suele estar perdido en correos

9:38

o en la cabeza del comercial más veterano.

9:40

Total.

9:41

Pues agrupan todo eso en un cuaderno de

9:43

noticias.

9:43

Y luego le dicen a Cloud que crea

9:45

una herramienta para los empleados.

9:46

Pero no un manual, ¿eh?

9:48

Cloud programa una página web interactiva con buscador.

9:51

Literal.

9:52

Analiza las quejas, las soluciones, diseña la interfaz

9:55

y la despiega.

9:56

Para que los empleados busquen ahí los argumentos

9:58

en tiempo real.

9:59

Si conectamos esto con el panorama general, te

10:01

das cuenta del valor incalculable de retener el

10:04

por qué se tomaron ciertas decisiones de negocio.

10:07

La memoria de la empresa, claro.

10:08

Evitas que ese conocimiento se esfume cuando alguien

10:11

del equipo se va a otro trabajo.

10:12

Se queda todo blindado.

10:13

Ya.

10:14

A ver, ver todo esto en acción suena

10:16

a magia, pero requiere una configuración técnica.

10:19

Y aquí es donde la gente empieza a

10:21

sudar.

10:21

Hay que bajar a la sala de máquinas.

10:23

Sí, hay cierta fricción al principio.

10:25

Hay que usar la terminal.

10:27

Entonces, ¿qué significa todo esto?

10:29

Porque claro, hablas a la audiencia de la

10:31

terminal y de ejecutar un código Bash y

10:33

suena a que vamos a hackear el Pentágono.

10:35

A la gente le da miedo meter contraseñas

10:37

ahí.

10:37

A ver, tranquilidad.

10:38

Yo entiendo el pánico a la pantallita negra,

10:40

pero está todo automatizado.

10:42

Un archivo Bash es solo una receta.

10:44

Vale.

10:45

Lo descargas, lo arrastras a la terminal, en

10:48

Mac o en Windows y ya.

10:50

Se instalan los paquetes necesarios, como Homebrew en

10:53

Mac, para conectar Google con lo que llamamos

10:55

Cloud Code.

10:57

Pero, ¿y las contraseñas?

10:59

Súper seguro.

11:00

El script no te pide claves.

11:02

Te abre el navegador, te lleva a Google

11:04

y te validas ahí, con el protocolo OAuth.

11:07

O sea, un pase VIP sin dar tu

11:09

clave real.

11:10

Exacto.

11:12

Con un esfuerzo de 5 minutos.

11:13

Y te da una ventaja absurda sobre el

11:15

99 % de la gente.

11:17

Vale.

11:18

Y una vez conectado, entran en juego las

11:20

famosas skills, las habilidades en formato .md.

11:24

Sí.

11:24

Como la skill NotebookLMSSkill .md.

11:28

Son directrices para que Cloud sepa cómo consultar

11:31

la información.

11:32

Pero la joya de la corona es la

11:34

del bucle de retroalimentación.

11:36

Cuéntame eso.

11:36

Hay otra skill que se llama Resumen con

11:39

Note.

11:40

Imagina que qué pasas una hora debatiendo.

11:42

¿Estás hablando con Cloud sobre un proyecto?

11:43

Vale.

11:44

Al terminar, Cloud hace un resumen de todo

11:47

lo hablado, de las conclusiones brillantes, y lo

11:50

envía automáticamente de vuelta a NotebookLM.

11:53

¡Qué barbaridad!

11:54

O sea, alimenta el cuaderno con la propia

11:57

charla.

11:57

Cierra el círculo.

11:59

Crea un segundo cerebro que evoluciona solo.

12:01

Pero claro, hay una gran limitación.

12:04

La guerra de IPs.

12:05

Porque todo esto tiene truco.

12:07

Sí, tiene que ser en local.

12:08

Usando Cloud Code o la app de escritorio.

12:12

No funciona en la versión colaborativa Cowork.

12:14

¿Y eso por qué?

12:15

Porque desde Cowork las peticiones salen con la

12:18

IP de la empresa Antropic.

12:20

Y Google, que es dueña de NotebookLM, pues

12:23

ve a su rival llamando a la puerta

12:25

pidiendo datos a lo bestia.

12:26

Claro.

12:27

Los bloquean por seguridad.

12:29

Exacto.

12:29

Google corta el grifo.

12:31

Así que de momento hay que usarlo en

12:33

local, con tu IP personal.

12:35

O sea, en tu propio ordenador.

12:37

Eso es.

12:37

Y esto plantea una pregunta importante para cerrar.

12:41

Dime.

12:42

Si creamos un sistema que no solo almacena

12:44

la información de un negocio, sino que automatiza

12:48

el aprendizaje, diseña webs para los empleados y

12:51

documenta cada conversación en un bucle infinito de

12:54

memoria, llegará un punto en que este segundo

12:57

cerebro comprenda a la empresa mejor que los

12:59

propios humanos que la fundaron.

13:01

Ostras.

13:02

Pues ahí queda eso para pensar.

13:04

Antes de despedirnos hasta el próximo programa, os

13:06

informamos de que las voces que oyes han

13:08

sido generadas por la IA de NotebookLM y

13:11

que dirigieron el programa de la empresa Antropic.

13:12

Siguiendo el podcast se encuentra Julio Pablo Vázquez,

13:14

un humano que te envía saludos.

13:16

En caso de error, probablemente sean errores humanos.

13:19

Nos escuchamos.

13:31

Y hasta aquí el episodio de hoy.

13:33

Muchas gracias por tu atención.

13:45

Esto es BIM Praxis.

13:47

Nos escuchamos en el próximo episodio.