domingo, 23 de enero de 2022

GOOGOL: su historia y algo más.

 

Historia

Este motor de búsqueda surge en 1996 cuando Larry Page en su tesis de doctorado idea un sistema para ordenar las páginas web, utilizando el modelo de citación utilizado en el mundo académico; es así que surge PageRank, el algoritmo original de Google que permite rankear (ordenar) documentos.

A este proyecto de Page se une su amigo Sergey Brin, quien aporta la cuota matemática. En el primer test del programa creado, llamado Backrub, (el cual trata de descubrir todas las páginas enlazadas al backlinks de una página) lograron indexar 15 millones de páginas. 

Estos amigos lograron convertir la web en una ecuación gigantesca, el PageRank; esta ecuación lo que hace es simular el comportamiento de una persona que busca en la web; de forma simple es la posibilidad de que se llegue a una página siguiendo enlaces al azar.


                                                     Imagen 1: Historia de Google. 

¿Y su nombre?

Serendipia, la idea inicial era colocar el nombre de Googol (1100) pero por error, Page escribió Google al inscribir el dominio. Luego Brin creó el logo y la página de inicio del motor de búsqueda. Es así que el año 1998 comienza su funcionamiento oficialmente.

Algoritmo. 

¿Algoritmo? En palabras sencillas  son secuencias de instrucciones y pasos para resolver un problema; se caracterizan por ser precisos y  definidos. Hagamos el siguiente ejercicio: colocar una palabra el buscador de Google ¿Cómo ha decidido Google el orden de los resultados? mediante un algoritmo; este algoritmo es una ecuación matemática que hace posible rankear las búsquedas, imagínense la magnitud de esa ecuación, la cual  que debe integrar millones de variables en cada búsqueda.

                                                          Imagen 2: Fórmula de PageRank 

Para comprender el algoritmo de Google, es necesario recurrir a los grafos. Pero no se asusten con las Matemáticas, grafos hay en todo.  ¿Quién no vio en la escuela Genética y tuvo que construir un árbol genealógico?  O en su defecto, dibujar en Química orgánica un compuesto, ambos son ejemplos de grafos. 

¿Y dónde están los grafos en la computadora?

Los grafos son representados computacionalmente mediante una matriz de adyacencia.

Sea V = {v1 . . . v|V|} el conjunto de vértices del grafo G, y E el conjunto de sus aristas. La matriz de adyacencia será una matriz de tamaño |V| × |V|, donde la entrada (i, j) será ai, j = ( 1 si existe una arista de vi a vj, y  0 en otro caso. 


                                                                Imagen 3: Ejemplo de matriz. 

Imagen 4: Representación de un grafo al aplicar PageRank

ALGORITMOS DE GOOGLE

PageRank está conformado por una serie de algoritmos matemáticos  que permiten ordenar de forma numérica la relevancia de las diversas páginas web; al evaluar de manera numérica cada uno de los enlaces que nos direccionan a una página, y la suma de todas estas, entrega el PageRank. Esta medida comprende un intervalo que va del cero al diez.

Google  interpreta un link de una página web “X” a una página “Y” como si fuese “un punto” para  la “Y”, pero también tiene en cuenta cuál es la página web que da el “punto” o “backlink”.  Cada link que apunta hacia una página web  suma una cantidad numérica la que Google calcula obteniendo el PageRank.

Este cálculo, explicado de manera sencilla y resumida:

A partir del grafo de  una web, con por ejemplo 7 páginas, cada una de estas  está representada por un nodo. Los hipervínculos que las unen son  representados mediante las flechas que a su vez corresponden a vínculos  dirigidos.


                                                          Imagen 5: Grafo y sus siete nodos  

Se asignará un  1 cuando una página esté relacionada con otra. En el caso contrario se asigna 0. Además, cuando la página está relacionada con ella misma también se asigna 0  y se procede a  representar los datos mediante una matriz, luego se calculan los valores de un vector ऺ(v=ranking inicial) que represente el PageRank  de cada una de las páginas.

¿PageRank es el único algoritmo de Google?

PageRank es el principal, sin embargo existen:

Discovery es el algoritmo que rastrea la web para identificar nuevas páginas y sitios que Google no ha indexado previamente.  Este algoritmo busca URLs y las compara con las  URLs conocidas.

El algoritmo de rastreo  busca y comprende toda la web, solo rastreará una página, no evaluará la calidad del contenido.

Algoritmo de Indexación, determina si la URL se incluirá en el índice de Google.

Algoritmo de clasificación,  usa la información de los algoritmos anteriores a fin de clasificar a cada página (rankear) bajo parámetros como: intención de la consulta y cómo coincide con la intención del contenido, relevancia de la página para la consulta, calidad del contenido, usabilidad de la página, contexto y configuración.

 Un quinto algoritmo es el  procesamiento de lenguaje natural, denominado BERT.

Además destacan: Google Panda, Google Penguin, Google Hummingbird, Google Pigeon, Google Mobilegeddon y Google RankBrain.

 

Fuentes:

¿Cómo funcionan los algoritmos? https://ockier.es/blog/funcionamiento-algoritmos-google/

Capítulo 2: Grafos y algoritmos https://www.dm.uba.ar

Jerez, R. (2018). Análisis del PageRank como factor de peso en la clasificación automática de textos. Tesis PUCV. 

viernes, 21 de enero de 2022

MARATÒN DE DR. STONE: LO INVISIBLE DE LO VISIBLE

 

INTRODUCCIÒN

¿Quién no ha visto alguna vez animé? El que esté libre de pecado que lance la primera piedra. Series memorables: Detective Conan, Caballeros del Zodiaco, Evangelion, Demon Slayer, etc.  Y es que las mezclas de cultura, ciencia, tecnología y sociedad no dejan indiferente a nadie, independiente de la edad y el género, hay para todos los gustos.

Sin embargo, este escrito se referirá a Dr. Stone, serie que la autora ha estado viendo por capítulos.  Este animé centra su trama en que la humanidad fue petrificada y el protagonista de esta historia,  Senku,  un joven muy inteligente que antes de la petrificación participaba del  club de química de su escuela, es el encargado de reconstruir la civilización (obtener cada uno de los grandes hitos de la ciencia)  y despetrificar a la humanidad tras 3700 años desde este hecho.






Senku, manteniendo su conciencia y  la noción del tiempo logra despetrificarse y se apoya en su amigo Taiju a quien despetrifica. Para reconstruir la civilización que se conocía antes de la petrificación, Senku contaba con la Naturaleza, su creatividad, conocimientos, trabajo en equipo y un buen grado de serendipia y paciencia.

Es en este contexto que se plantea la siguiente pregunta ¿Qué detalle de la primera temporada de la  serie se ha  pasado por alto al verla por capítulos?

El objetivo de este peculiar ejercicio es analizar en una maratón todos los capítulos de la primera temporada  de Dr. Stone para verificar qué detalles no han sido considerados al ver los capítulos por separado.  

MÈTODO

Este es un estudio documental,  en el cual se lleva a cabo una maratón de la temporada 1 de la serie Dr. Stone. Se realiza un análisis de contenido a partir de un medio audiovisual y se enmarca en el Paradigma Fenomenológico.

Se dedica un día para revisar la serie y se anotan aquellos hechos que se han pasado por alto en visualizaciones anteriores.

RESULTADOS

 Tras analizar todos los capítulos de Dr. Stone, primera temporada, con el propósito de  verificar qué detalles no han sido considerados al ver los capítulos por separado, se reportan los siguientes resultados.

La genialidad de Senku al producir electricidad por inducción.

La petrificación no la concibo (ni siquiera a partir de un rayo).

La despetrificaciòn de materia orgánica a partir de ácido nítrico no la concibo (y que un ser humano mediante este método despierte intacto), se rescata que es correcto el color amarillo de la sustancia y su fuente de obtención.

Es fácil de hacer la bebida que siempre toma Senku; aparecen fórmulas y procedimientos químicos  correctos como por ejemplo  el de la de la pólvora negra (solo hacer el alcance que en la serie  se menciona que lo más importante en la obtención de la pólvora negra  es el Hierro; sin embargo es el nitrato de potasio y la compresión a utilizarse debe ser mayor).  

Llama la atención que Senku se divorcia en un tiempo record.

El ácido sulfúrico es el compuesto más importante de los que Senku utiliza (lo consigue de un volcán) y se ocupa para la síntesis de todos los químicos.

Se destaca que en todos los episodios se tiene particular cuidado para manipular los compuestos químicos se toman las medidas de precaución, se advierte de vapores y procedimientos mortales.

Los personajes exageran las virtudes y errores de la humanidad.


DISCUSIÒN

La serie Dr. Stone podría catalogarse como una joya del animé, dado que es una mezcla humanidad, Ciencia, Tecnología y una trama que entretiene.  Es recomendable para poder aprender de manera teórica y práctica las ciencias experimentales (teniendo los conocimientos básicos de cada disciplina).

Desde otro punto de vista, la ciencia que se muestra es humanizadora, cotidiana, da cuenta del trabajo en equipo, de la importancia del error y valores que para la sociedad son necesarios.

Por lo atractivo del personaje principal se corre el riesgo que un adolescente sin identidad pueda imitarlo,  quien a pesar de ser un genio, no escapa a la ficción; tal como ocurre con algunos seguidores de este género. El riesgo de este hecho  está en que algún joven quiera “experimentar” replicando escenas de la serie, las cuales son en extremo peligrosas, por eso es recomendable que esta serie sea parte de las clases de ciencias, en las cuales se analice cada hito del personaje.

En resumen, este animé es una reconstrucción histórica de los grandes hitos científicos y tecnológicos, no les cuento más y los invito a verlo. 







miércoles, 19 de enero de 2022

DESCUBRÌ VIDA EN MARTE… ¿Y?

 

Los invito a realizar el siguiente ejercicio. Supongamos que usted es un  científico, por ejemplo, un astrónomo y ha descubierto vida en Marte.  ¿Qué hace? Querer gritarlo al mundo.

¿Alternativas? : Compartir en sus redes sociales, ronda de prensa, llamar a sus colegas. Ninguna de las alternativas anteriores.  Sino publicas tu descubrimiento mediante un artículo científico (paper), tu descubrimiento no existe, no tiene el reconocimiento científico.

Un artículo científico está estructurado en 4 secciones: introducción, método, resultado y discusión (IMRYD) o IMRAD (por sus siglas en ingles). Responde a: ¿Qué se estudió? ¿Cómo se estudió? ¿Cuáles fueron los resultados? ¿Qué significan esos resultados?

He aquí  dos ejemplos de trabajos de investigación que los invito a revisar.

Pantoja, J.C., Covarrubias, P. (2013).  La enseñanza de la biología en el bachillerato a partir del aprendizaje basado en problemas (ABP). Perfiles Educativos. 35(139), 93-109. https://doi.org/10.1016/S0185-2698(13)71811-7

Esta investigación presenta la estructura IMRAD, con el alcance que los resultados y discusión se encuentran juntos y en otro apartado las conclusiones: resumen, palabras clave, abstract, keywords, introducción, método, resultados y discusión, conclusiones y referencias.

 Barreyro, J.P., Injoque-Ricle , I., Álvarez-Drexler, A.,  Formoso, J., Burin, D. (2017). Comprensión de textos expositivos: el rol de la memoria de trabajo y el conocimiento previo específico. Suma Psicológica. 24(1),  17-24. https://doi.org/10.1016/j.sumpsi.2016.09.002

Este artículo presenta claramente la estructura IMRAD: resumen, palabras clave, abstract, keywords, introducción, método, resultados, discusión y referencias.


Cabe señalar que esta estructura de artículo científico varía según el tipo de texto: trabajos de investigación, trabajos metodológicos, revisiones, cartas, estudios de caso, editoriales, etc.; además depende de la editorial donde se publique. 


lunes, 17 de enero de 2022

#NOQUIEROCREERQUIEROSABER PARTE 1

 

Hablar de conocimiento genera cierta confusión, dado que para algún@s lo es una fórmula de cinemática, mientras que para otr@s, puede ser la personalidad de los tauro.  Ciencia v/s pseudociencia.  Por tal motivo,  es fundamental recurrir a la epistemología.

De acuerdo a cierto consenso dentro de la epistemología, una afirmación es pseudocientífica si cumple con estas tres condiciones: a) referirse a un tema dentro del dominio de la ciencia  b) Sufrir de una falta de fiabilidad y  c) sus proponentes intentan crear la impresión de que representa el conocimiento más confiable en un tema.

Siguiendo esta idea, Hansson (2017), filósofo de la ciencia plantea entre otras características epistemológicas de las pseudociencias:

1)    1) "la cosecha de cerezas": las pseudociencias  aprovechan las "cerezas" que contradicen el consenso científico  mayoritario. En palabras de Kuhn “anomalías”.

Por ejemplo, el famoso paper de The Lancet en el que se asociaba el autismo a las vacunas (ya desacreditado) y que aún es aprovechado por movimientos antivacunas;  otro ejemplo es  sacar de contexto citas que hablan de desacuerdos entre investigadores,  tal es el caso de las discrepancias  en la evolución, lo cual aprovechan para difundir que no existe.

2)    2)  construir falsas controversias: cuando no se puede convencer a la gente de la existencia un punto de vista "alternativo", se afirma que el tema está abierto y que está siendo discutido por la ciencia. Esto sucede con los negacionistas, por ejemplo los terraplanistas o negacionistas del cambio climático, quienes usan los medios de comunicación para enseñar sus “teorías”.

En tanto, la homeopatía  y la astrología, como promotores de pseudoteorías, no intentan generar controversias con la ciencia sino todo lo contrario, afirman ser formas complementarias del saber científico. Sus explicaciones apelan a la emotividad y fácil comprensión de la gente; por ejemplo, los terraplanistas en sus “demostraciones” hacen uso directo de los sentidos, los homeópatas indican “las abuelitas te daban un té de menta para el dolor de estómago”. 

Como lo hace notar Isaac Asimov en el artículo “Un culto a la ignorancia”, estamos  frente a una ola de anti-intelectualismo, en la cual "mi ignorancia vale tanto como tu saber" o "no confíes en los expertos", lo actualmente se encarna por fenómenos de posverdad como que el calentamiento global no tiene origen antrópico, la plandemia, etc.  Es así que hoy el caballito de batalla es “todas las creencias son respetables”.

¿Ahora quién podrá defendernos?

 

Fuente: Álvarez, M. (2019). Elementos para el análisis de las pseudociencias.

jueves, 13 de enero de 2022

ATENCIÒN FUTURANÀTICOS: FUTURAMA Y SU MÀQUINA DE INTERCAMBIO DE MENTES.

 

El capítulo 10 de Futurama, “El prisionero de Benda” (The Prisoner of Benda, emitido el 19 de agosto de 2010) hace referencia a un antiguo libro  titulado “El prisionero de Zenda” - el cual habla de cómo un rey cambia de vida con un campesino-  incluye una demostración relacionada con las permutaciones del matemático y guionista  Ken Keeler, graduado con honores de Harvard (1990), quien  dejó la investigación para dedicarse a la televisión, destacando principalmente como escritor y productor en  Los Simpson y Futurama.

El Teorema de Keeler explica el cambio de mentes y cuerpos, este teorema recibió un reconocimiento de la Academia Americana de Física y publicaciones como  The Futurama of Physics. APS Physics ,Vol 19, No 5, 2010.

El argumento

Una flamante maquina creada por el  Profesor Farnsworth, permite intercambiar mentes entre dos cuerpos; pero esta máquina  tenía un defecto, una pareja de cuerpos sólo puede intercambiar mentes una vez. Este hecho da a lugar a toda clase de cómicas situaciones con los cambios de mentes entre los personajes. No obstante, las matemáticas al rescate: mediante una demostración constructiva se logra que todos los personajes vuelvan a sus propios cuerpos con la ayuda de únicamente dos cuerpos auxiliares.



Explicación

Teorema de Futurama: No importa cómo un grupo de gente haya intercambiado sus mentes y sus cuerpos, siempre es posible que cada persona recupere su cuerpo usando dos personas extra.

Sea A un conjunto finito y, sean X e Y dos elementos que no pertenecen a A.

Toda permutación de A se puede reducir a la identidad mediante una sucesión de transposiciones de

                                                                     A∪{X,Y}

Cada una, de las cuales contienen a X o Y

X e Y son dos personajes nuevos con los cuales se demuestra esta teoría:



Como toda permutación, se descompone en productos de ciclo distinto, y bastaría  demostrar el teorema para un ciclo de  π sin pérdida de generalidad.


Lo anterior, se explica  de manera sencilla, mediante las siguientes relaciones: el número que no está entre paréntesis será el cuerpo, y el número que está entre paréntesis, es la mente del portador.

El personaje 1(1) cambia mentes con el personaje 2(2), pero al no poder intercambiar su mente entre ellos, entonces entran los personajes 3(3) y  4(4), quienes cambian mentes entre ellos. 4(3) junto al personaje 3(4)  cambian con 1(2) y 4(3) respectivamente, pasando a ser 1(3) y 4(2) y  además 3(1) y 2(4). Estos para recuperar sus mentes tienen que intercambiar 4(2) con 2(4) y 1(3) y 3(1), los cuales volverían a quedar al final como 1(1) 2(2) 3(3) 4(4).


En conclusión, el teorema queda demostrado, dejándonos una grata lección, en los contextos más simples -como una serie animada- podemos aplicar  un teorema que por sí mismo no es de fácil comprensión. 


sábado, 8 de enero de 2022

DE PANDEMIA EN PANDEMIA.

 

Remontémonos hacia el 10 de agosto del año 2010, día en que  la Directora General de la Organización Mundial de la Salud (OMS), declara al mundo que se levanta la alerta pandémica, tras superar la pandemia  causada por  virus de la influenza A (H1N1) iniciada el año 2009,  dando inicio al período post-pandémico. Desde este momento,  el virus de la influenza A (H1N1) se comportaría como un virus estacional, con el cual en adelante debemos aprender a convivir ya que continuará circulando en los próximos años y con diversas mutaciones.

Según lo anterior,  desde 2011 se han reportado diversos brotes en América  y Europa, aunque limitados a regiones geográficas específicas, motivo por el cual las diversas autoridades deben estar alertadas y preparadas para actuar activando los protocolos formulados durante el periodo pandémico.

Por su parte, en Chile, el  MINSAL  en su informe de Influenza Semana Epidemiológica 1 a 52 de 2011, reportó que pruebas moleculares confirmaron un virus de influenza triple recombinante (influenza A (H3N2) (SOtrH3N2) con el segmento M del gen proveniente del virus pH1N1.

UN  SÚPER NÙMERO.         

Durante el contexto de pandemia, destacó un número usado  en salud pública, hablamos del número reproductivo básico (R0), el cual sirve para estimar la velocidad con que una enfermedad puede propagarse en una población. Además, este número permite predecir el porcentaje de individuos que enfermarán durante un brote en una población dada; siendo este último el parámetro que se pronostica de forma más aceptable mediante las estimaciones del R0.

               Esquema 1: Intervenciones para controlar una pandemia con reducción del RO.

El R0 también se puede aplicar provechosamente para pronosticar (en un modelo simple), la duración de una epidemia (figura 1), dado que  tanto el RO como el tiempo que transcurre entre la incidencia acumulada de 5% y la de 95% no dependen de N.

Figura 1: La dependencia de la duración de la epidemia con respecto la tasa de transmisión en un modelo SIR


En conclusión, la estimación del R0 en una población puntual  es útil para entender la transmisión de una enfermedad en ella. Si se considera el R0 en conjunto con otros parámetros epidemiológicos importantes, permite conocer mejor un brote epidémico y preparar la respuesta sanitaria. No obstante, el R0  por sí solo es una medida insuficiente de la dinámica de las enfermedades infecciosas en las poblaciones.

Solo queda esperar que la actual pandemia por COVID-19 siga el mismo curso que la pandemia por A (H1N1).

 

Fuentes:

Ridenhour, Kowalik, Shay.   (2018).   Am J Public Health December; 108(Suppl 6): S455–S465. Spanish. doi: 10.2105/AJPH.2013.301704s

Ministerio de Salud Chile.  (2011). Informe de Influenza. Semana Epidemiológica 1 a 52