Wednesday, October 19, 2005

How Internet Cookies Work?



Híjole.. éste post está un poco largo.. pero es algo que está muy ligado a lo que se empezó a comentar a partir del post de google earth y creo que es información harto valiosa para cualquiera que se dispone a navegar al amparo del anonimato que le da estar tras su computadora, en el cuarto de su casa.. MUAJAJAJAJA! van a sentir meeeello!
Artículo tomado del respetable sitio:
http://www.howstuffworks.com/cookie.htmtraducido por acá su servilleta, nomás pa' que no digan "ay es que yo no sé leer inglés.." maricones!.. jajajaja.. no se crean.. es que quiero que sientan meeeello!! MUAJAJAJAJAJA!! MUAJAJAJAJAJA!!
comenzamos.. los comentarios en rojito son míos.. sólo hay uno o dos..

¿Cómo funcionan las cookies en Internet?
Muchas cookies son increiblemente simples, pero son una de esas cosas que han tomado vida propia. Las Cookies empezaron a recibir una tremenda atención de los medios en el 2000 debido a las preocupaciones sobre la privacidad en Internet, y el debate aún continúa. Por otro lado las cookie pueden ser herramientas que facilitan la navegación en la red. Los diseñadores de casi todos los sitios importantes las usan porque permiten mejorar la experiencia del usuario y hacen mucho más fácil recabar información sobre sus visitantes.
En este artículo echaremos un vistazo a la tecnología básica detrás de las cookies, así como algunas características que posibilitan.
Lo que se debe saber:
En abril del 2000 leí en un profundo artículo sobre la privacidad en Internet, en un largo y respetado periódico. Ese artículo contenía una definición de las cookies. Parafraseando, la definición iba más o menos así:
Las cookies son programas que los sitios en Internet colocan en tu disco duro. Se establecen en tu computadora reuniendo información sobre ti y todo lo que haces en Internet, y cuando la página lo desee puede descargar toda la información que la cookie haya recolectado. [incorrecto]
Definiciones como esa son muy comunes en la prensa. El problema es que nada de esa información es correcta. Las cookies no son programas, y no funcionan como un programa lo haría. Por lo tanto, no pueden reunir información por sí mismas. Así como tampoco pueden recolectar ninguna información sobre tí de tu computadora.
La que sigue es una definición válida de una cookie:
Una cookie es una fragmento de texto que un servidor de Internet puede almacenar en el disco duro de un usuario. Las cookies permiten a un sitio en Internet guardar información en una computadora y después recuperarla. Las piezas de información son almacenadas como pares de “nombre-valor”.
Por ejemplo, un sitio en Internet puede generar un número de identificación (ID) para cada visitante y almacenar dicho ID en cada computadora usando una cookie.
Si usas Internet Explorer para navegar en la red, puedes ver todas las cookies que están almacenadas en tu computadora. El lugar más común en el que se pueden encontrar es en este directorio c:\windows\cookies. [si están usando Windows XP las pueden encontrar en esta ruta C:\Documents and Settings\Nombre de usuario\Cookies]
Cuando ví ese directorio en mi computadora encontré 165 archivos. Cada archivo es un archivo de texto que contiene pares “nombre-valor”, y hay un archivo por cada sitio en Internet que ha almacenado cookies en mi computadora.
Puedes ver en esta carpeta que cada uno de estos archivos es un simple archivo de texto. Puedes ver qué sitios en Internet han almacenado un archivo en tu computadora a partir del nombre del archivo (la información está también contenida dentro del archivo). Y puedes abrir cada archivo al hacer clic en él.
Por ejemplo, yo visité goto.com y el sitio instaló una cookie en mi computadora. La cookie de goto.com contiene la siguiente información:
UserID A9A3BECE0563982D www.goto.com/
El valor es A9A3BECE0563982D. La primera vez que visité goto.com, el sitio me asignó una ID única y la almacenó en mi computadora.
Amazon.com almacena un poco más de información en mi computadora. Cuando abrimos el archivo que Amazon ha creado en nuestra computadora podemos ver que contiene lo siguiente:
session-id-time 954242000 amazon.com/session-id 002-4135256-7625846 amazon.com/x-main eKQIfwnxuF7qtmX52x6VWAXh@Ih6Uo5H amazon.com/ubid-main 077-9263437-9645324 amazon.com/
Al parecer Amazon almacena una ID por cada usuario, una ID por cada sesión y el tiempo en que la sesión comenzó en mi computadora (así mismo guarda un valor x-main, que puede significar cualquier cosa)
La gran mayoría de las páginas guardan una sola información –un ID de usuario- en tu computadora. Pero un sitio puede almacenar cuantos pares “nombres-valor” crean convenientes.
Un par “nombre-valor” es simplemente un pedazo de información. No es un programa, y no puede “hacer” nada. Un sitio en Internet puede recuperar solamente la información que él mismo ha guardado en tu computadora. No puede recuperar información de otras cookies, ni mucho menos de tu computadora.
[a partir de aquí sintetizaré un poco porque no quiero aburrirlos demasiado, si les interesa pueden checar la versión completa, pero en inglés en … al final ya no la sinteticé tanto porque está harto interesante...]
¿Cómo se mueven los datos de una cookie?
Los datos se mueven de la siguiente manera:- Si tecleas la dirección URL de cualquier página, tu navegador envía una petición al servidor por la página. Por ejemplo si tecleas la URL http://www.amazon.com en tu navegador, éste contactará al servidor de Amazon para pedir si página principal.

- Cuando el navegador hace esto, verificará si en tu computadora existe una cookie que Amazon haya almacenado. Si la encuentra enviará todos los pares “nombre-valor” del archivo al servidor de Amazon junto con el URL. Si no encuentra la cookie no enviará ningún dato más allá del URL.

- Entonces el servidor de Amazon recibe los datos de la cookie y la petición de la página. Si los datos son recibidos, Amazon puede usarlos.

- Si Amazon no recibe ningún par de datos, Amazon interpreta que nunca los has visitado antes y el servidor crea una nueva ID para tí en su base de datos y envía pares “nombre-valor” a tu computadora en el “header” de la página que te está enviando. En ese momento tu computadora almacena los pares de datos en tu disco duro.

- El servidor puede cambiar los pares de datos o añadir nuevos, recuperando la información almacenada, cada vez que visitas la página.
Existen otros tipos de información que el servidor puede enviar en el par “nombre-valor”. Una es la fecha de expiración de la cookie y la otra es un “path”, con el que el sitio puede asociar diferentes valores de la cookie con diferentes secciones del sitio.
Tú tienes control sobre éste proceso. [sisisisisisi cómo no?] Puedes habilitar la opción en tu navegador para que te informe cada vez que un sitio te envía un par “nombre-valor”, una cookie. Y puedes aceptar o negar los valores.
[Aunque en algunas ocasiones no es recomendable porque se dificultaría tu experiencia de navegación en algunas páginas, como ésta..]
¿Cómo usan las cookies los sitios web?

Las cookies evolucionaron porque resolvieron un gran problema para las personas que utilizan sitios en Internet. En el sentido más amplio, una cookie permite almacenar información de “estado” en tu computadora. Esta información le permite al sitio recordar en qué “estado” está tu navegador. Un ID es un simple pedazo de información de “estado” – si un ID existe en tu computadora, el sitio sabe que lo has visitado antes. El “estado” es, “Tu navegador ha visitado el sitio al menos una vez” y el sitio reconoce el ID de esa visita.
Los sitios en Internet utilizan las cookies en diferentes maneras. Los siguientes son algunos de los ejemplos más comunes:
Los sitios pueden determinar exactamente cuántas personas en realidad los visitaron. La única manera de contarlos más acertadamente es instalando una cookie con un ID único para cada visitante. Así los sitios pueden determinar:

o Cuántos visitantes tuvieron
o Cuántos son nuevos y cuantos ya lo habían hecho
o Con cuánta frecuencia los visita cada uno
La manera en la que un sitio puede hacer esto es usando una base de datos. La primera vez que un visitante llega, la página crea un nuevo ID en la base de datos y envía el ID como una cookie. La próxima vez que el usuario regrese, el sitio puede incrementar el contador asociado con ese ID en la base de datos y así saber cuántas veces ese visitante regresa.
Los sitios pueden almacenar preferencias de usuario, para que la página pueda verse diferente para cada visitante (muchas veces llamado “customization”). Por ejemplo si tú visitas msn.com, te ofrece la posibilidad de cambiar el color, contenido y disposición de los elementos. También te permite ingresar tu código postal y así obtener información sobre el clima personalizada. Cuando ingresas el código postal, el siguiente par “nombre-valor” se añade a tu cookie:
WEAT CC=NC%5FRaleigh%2DDurham®ION= www.msn.com/
Si les digo que yo vivo en Raleigh, NC, esto adquiere sentido.
Muchos sitios almacenan estos datos en la base de datos en su servidor y no almacenan nada más que el ID como cookie.
Los sitios de comercio electrónico pueden implementar cosas como los carritos de compras y las opciones de comprobación rápida. La cookie contiene un ID y le permite al sitio seguir un rastro tuyo así como de los diferentes productos que agregas a tu carrito. Cada producto que agregas al carrito se almacena en la base de datos del sitio junto con tu valor ID. Cuando terminas, el sitio sabe qué hay en tu carrito recuperando la información almacenada temporalmente en la base de datos. Sería imposible implementar un mecanismo de compras en línea tan conveniente sin la existencia de las cookies o algo parecido.
En todos estos ejemplos, noten que cada base de datos permite almacenar cosas que hayas seleccionado del sitio, páginas que hayas visto, información que le hayas dado al sitio en formularios, etcétera. Toda la información es almacenada en la base de datos del sitio y en la mayoría de los casos la cookie sólo contiene un valor ID.
Problemas con las cookies
Las cookies no son un mecanismo perfecto, pero ciertamente permiten muchas cosas que serían imposibles de otra manera. Aquí se enlistan algunas de las características que hacen a las cookies imperfectas:
- Muchas veces las computadoras son compartidas – Cualquier computadora pública, y muchas computadoras utilizadas en una oficina o en la casa, son compartidas por múltiples personas. Digamos que utilizas una computadora pública (en una biblioteca, por ejemplo) para comprar algo en una tienda en línea. La tienda dejará una cookie en esa computadora y alguien podrá después intentar comprar algo de la tienda usando tu cuenta. Las tiendas actualmente alertan a sus clientes sobre este problema y ésa es la razón. De cualquier forma los errores suceden. Por ejemplo, una vez hice una compra desde la computadora de mi esposa en Amazon. Más tarde, ella visitó Amazon y le dio clic al botón “one-click”, sin percatarse de que en realidad había comprado un libro en exactamente un clic.
En sistemas operativos como Windows NT o UNIX que utilizan cuentas de usuario apropiadamente, ése no es un problema. Las cuentas separan todas las cookies de cada usuario y las almacenan en diferentes directorios. El uso de cuentas es más relajado en otros sistemas operativos. He ahí el problema.
- Las cookies son borradas – Si alguna vez tienen un problema con su navegador y llaman al soporte técnico, la primera vez cosa que les van a pedir es borrar todos los archivos temporales de Internet. Cuando hacen eso, tambien borran todas las cookies de su computadora. Si visitan de nuevo cualquier página, el sitio pensará que son nuevos usuarios y les asignará una nueva cookie. Esto tiende a sesgar la exactitud al contar los regresos de los visitantes. Y también puede dificultar el proceso de recobrar las preferencias del sitio para cada usuario. Es por esto que algunos sitios te piden registrarte en algunos casos. Si te registras con un nombre de usuario y password, puedes ingresar al sistema, incluso si pierdes la cookie, y conservar tus preferencias, porque son almacenadas en la base de datos del sitio.
- Computadoras múltiples – Las personas a menudo utilizan más de una computadora durante un día. Por ejemplo, yo tengo una computadora en la oficina y una computadora en casa, además una laptop para el camino. A menos que el sitio esté diseñado para específicamente resolver el problema, tendré tres únicas cookies en cada una de mis computadoras. De nuevo, un sitio que permite el registro con nombre de usuario y password y almacena las preferencias centralizadamente, me puede facilitar el uso de la misma cuenta en las tres máquinas. Pero los diseñadores del sitio deben planear esto cuanto están desarrollándolo.
Probablemente no existan soluciones fáciles a estos problemas, excepto pedirles a los usuarios que se registren y almacenar todo en una base de datos central.
Entonces, ¿por qué tanto coraje contra las cookies?
Si han leído el artículo hasta este punto, se podrán preguntar por qué tanto coraje contra las cookies y la privacidad en Internet. Han visto en este artículo que las cookies son archivos de texto inofensivos, y también han visto que hacen posibles muchas cosas útiles en la red.
Hay dos cosas que han causado una fuerte reacción alrededor de las cookies:
La primera es algo que ha plagado a los consumidores por décadas. Digamos que compran algo por catálogo de la manera tradicional. La empresa a la que le realizan el pedido obtiene su nombre, dirección y teléfono de la orden. También sabe qué productos compraron. La empresa puede vender su información a otros que quieran venderles productos similares. Éste es el combustible que hace posible el telemarketing y el correo basura.
En una página, se pueden rastrear no sólo tus compras, sino también las páginas que has leído, los anuncios en los que has hecho clic, etcétera. Entonces, si compras algo e ingresas tu nombre y dirección, el sitio potencialmente conoce mucho más sobre tí que una compañía de correos tradicional. Esto hace el targeting mucho más preciso, y genera inconformidad en mucha gente.
Es por eso que muchos sitios han establecido políticas de privacidad cada vez que te piden tus datos. Pero caras vemos…
El segundo es único de Internet. Existen ciertos proveedores de infraestructura que pueden crear cookies que son visibles en múltiples sitios. DoubleClick es el ejemplo más famoso de esto. Muchas compañías usan DoubleClick para colocar banners en sus sitios. DoubleClick coloca un pequeño GIF (1x1 pixeles) en el sitio que le permite a DoubleClick buscar cookies en tu computadora. DoubleClick puede entonces rastrear todos tus movimientos a través de múltiples sitios. Puede potencialmente ver qué has tecleado en las búsquedas que has realizado en los motores de búsqueda (debido más a la manera en que algunos buscadores implementan sus sistemas, no por que intenten algo siniestro). Porque pueden recopilar más información sobre tí de múltiples sitios, DoubleClick puede formar perfiles muy ricos. Siguen siendo anónimos pero muy ricos en información.
DoubleClick ha ido un paso más allá. Para formar una compañía, DoubleClick amenaza con vincular esta rica y anónima información con nombres y direcciones, para personaliarla y venderla. Esto ya empieza a verse mucho más como una forma de espionaje. Y eso es por lo que ha causado tanto ruido.
DoubleClick y companies como esa están en la posición para lograr tales cosas, porque alimentan de publicidad los sitios de muchas empresas. Recopilar información de diferentes cookies no es algo posible desde un sitio individual, porque las cookies son únicas para cada sitio.

[Entonces ustedes dirán.. ¿hay o no hay por qué vivir en la paranoia?] MUAJAJAJAJAJA!!! MUAJAJAJAJAJA!!! MUAJAJAJAJAJAJA!!!

3 comments:

Anonymous said...

Me resulta poco amenazadora esta cuestión de las cookies, finalmente quien pudiera tener información de mis actividades en internet, la podría encontrar un poco escasa y un tanto ociosa.

Resultaría, más que amenazante, un poco molesto e insidioso el que te estén espiando y finalmente ho y por hoy los alcances son publicitarios, pero que tan más molesto sería que recibir tarjetitas en los altas, soplarte todos y cada uno de los comerciales en la tele, y tener que tirar todas y cada una de los folletos, boletines y chunche y media que te dejan en tu buzón sólo para producir más basura y hacer que el del carrito te cobre más.
Finalmente si el temor también son los virus, seguro ya habrá un antivirus contra eso también y entonces ricos se harán con nuestra muy dudable nececidad de cyberprivacidad.

He dicho... escrito.

nori said...

pues todo depende.. aunque sí.. creo que cada vez nos preocupamos menos por nuestra "ciberprivacidad".. habrá que ver..

Anonymous said...

Es como si alguien estuviera espiando por tu ventana. Quizá no te pase nada, pero seguro que no te gustaría...

:)