banquiers de la donnée

La Fatwa des Big Data et les banquiers de la donnée; Qu'est-ce que le big data ?
 

Article intéressant sur un sujet pas assez popularisé dans nos réseaux : je parle du fichage généralisé à travers les outils que nous utilisons tous les jours. Un fichage faisant intervenir des techniques de plus en plus poussées. Mais il nous laisse sur notre faim en n'indiquant pas comment nous en préserver.

Quelques pistes :

protéger son navigateur contre les intrusions intempestives. Exemple avec Firefox

- BetterPrivacy, pour éliminer les cookies indésirables : https://addons.mozilla.org/fr/firefox/addon/betterprivacy/
- Adblock plus, pour virer les pubs intrusives : https://addons.mozilla.org/fr/firefox/addon/adblock-plus/

Si vous êtes sous Windows, en plus de l'anti-virus à jour, utilisez des outils de nettoyage comme Ccleaner

Lire sa messagerie avec un outils adapté, c'est à dire pas avec son navigateur (je répète : PAS AVEC SON NAVIGATEUR). Exemple avec thunderbird qui bloque les contenus distants (https://www.mozilla.org/fr/thunderbird).

Un exemple de contenu distant : une image d'un pixel dans un mail. Quand vous lisez votre mail avec votre navigateur (ce que font 95% des gens), l'image se télécharge sur votre écran, comme elle fait 1 pixel, vous ne la voyez pas, mais vous avez donné pas mal d'infos au serveur depuis laquelle est est récupérée : votre langue, votre FAI, votre commune, votre système d'exploitation, votre navigateur, sa version, si vous acceptez les cookies, etc. Sans parler de l'info la plus importante pour ces collecteurs de données : derrière votre adresse email, il y a un véritable être humain qui lit son courrier.

Voyez par vous même : http://www.mon-ip.com/info-adresse-ip.php

Autant d'infos collectées qui alimentent le "big data" et se croisent avec d'autres infos que vous laissez sur le net : les sites que vous visitez, le temps passé sur chaque page, etc. Tous ces renseignements cumulés permettent d'établir un profil absolu de chaque internaute pratiquement aussi précis qu'une empreinte rétinienne.


Ne jamais signer une pétition si le lien ne correspond pas à une page réelle. C'est systématiquement le cas pour mesopinions.com, wesign.it, change.org... ce que j'appelle des aspirateurs à adresses emails. Privilégier les pétitions hébergées sur des sites militants.

Les purs et durs pourront aussi masquer leur adresse IP (c'est l'adresse de votre ordinateur quand vous êtes sur internet) à l'aide de techniques comme les VPN ou Tor

@+
Yannick

Le 02/03/2015 04:48, alainmouetaux a écrit :

 

  • Ayatollahs du marketing.

Là encore je me contente de vous renvoyer à l'excellente enquête d'Yves Eude sur Le Monde : "Comment notre ordinateur nous manipule". Quelques extraits :

"en trois clics, vous voilà fiché 108 fois par une quarantaine de bases de données. Si vous commencez à acheter le téléphone mais abandonnez en cours de route, vous serez repéré par la société française Criteo, spécialisée dans le « reciblage ». Des publicités pour le produit que vous avez failli acheter s'affichent sur votre écran pendant des jours, et vous suivront sur tous les sites que vous visiterez. Criteo a besoin de machines puissantes : pour identifier un internaute, contacter la plate-forme qui gère ses espaces publicitaires, proposer un prix, conclure l'affaire et lancer l'affichage de la bannière, elle dispose de 13 centièmes de seconde – faute de quoi l'espace sera vendu à un concurrent. Entreprise de taille moyenne, Criteo reçoit 20 teraoctets (vingt mille milliards) de données par jour, et touche 850 millions d'internautes par mois, certains des centaines de fois. (...)

Pour influer sur nos cerveaux, les publicitaires disposent d'une énorme puissance de calcul. Ils emploient des mathématiciens pour concevoir les algorithmes, des développeurs pour les traduire en langage informatique, des ingénieurs pour construire l'architecture des bases de données, des analystes pour capter et exploiter des données …

(...) L'espoir suprême des chercheurs est que les ordinateurs donnent du sens à des données diffuses et chaotiques, livrées en vrac. En découvrant des modèles et des corrélations qu'aucun humain n'aurait imaginé, ils répondront à des questions que personne ne leur a posées."

GAFA (Google Amazon Facebook Apple)
http://affordance.typepad.com/mon_weblog/2014/04/big-data-fatwa.html
----

Qu'est-ce que le big data ?

 

Le stockage et l'analyse de grandes masses de données

Capter et stocker un maximum de données

image big
            data Le Big data data bouscule de fond en comble nos manières de faire du "business". Le concept, tel qu'il est défini actuellement, englobe un ensemble de technologies et de pratiques destinées à stocker de très grandes masses de données et à les analyser très rapidement. 
Pour décrire le principe du big data, il est coutumier de résumer ses caractéristiques majeures en utilisant 3 lettres "V" :
Volume, Velocity, Variety.

Nous étudierons aussi au cours de ce dossier le métier clé de "data scientist" ainsi que les principes de fonctionnement des principales briques technologiques.

Les 3 "V"

  • "V" pour Volume

    La quantité de données générée est en pleine expansion et suit une loi quasi exponentielle. Le commerce électronique et les réseaux sociaux sont les grands contributeurs de cette profusion de données.
  • "V" pour Velocity (rapidité)

    La rapidité de renouvellement des données dans un monde connecté n'est plus à démontrer. Toutes les nouveautés et mises à jour sont stockées en respect de la devise du big data : "On garde tout!".
  • "V" pour Variety (variété)

    Les bases de données spécialisées sont en mesure de gérer la multiplicité des formats des données : numérique, texte, image...
Il n'est pas inutile d'y ajouter un quatrième "V" pour "valeur" comme le recommandent les pragmatiques qui sont aussi les mieux avertis (ou déjà échaudés...) de la pratique des technologies de l'information. Autrement dit, il faut bien que tout cela serve à quelque chose "d'utile"...

Suite : http://www.piloter.org/business-intelligence/big-data-definition.htm



03/03/2015

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 67 autres membres