Guillaume Plique's Avatar

Guillaume Plique

@yomguithereal.bsky.social

Research Engineer at SciencesPo's médialab.

82 Followers  |  128 Following  |  18 Posts  |  Joined: 10.10.2023  |  2.1803

Latest posts by yomguithereal.bsky.social on Bluesky

Il y a clairement des recouvrements oui. Les deux outils ne sont pas designés de la même manière ni avec les mêmes affordances ceci dit. Je pense que xan couvre plus de terrain et permet de produire des visualiations. xan est généralement plus rapide que miller, aussi et sait paralléliser autrement.

23.10.2025 19:42 — 👍 1    🔁 0    💬 0    📌 0

I don't know TEI very well, but if you know something like `xan from tei` would make sense (it might not be tabular enough for it to mean anythin though), let me know. `xan` has been first and foremost geared towards social sciences and digital humanities after all.

21.10.2025 14:28 — 👍 1    🔁 0    💬 0    📌 0

Sorry to eavesdrop here :) but I wonder whether the xan scrape command could take care of a least some subset of this endeavor?

21.10.2025 12:28 — 👍 0    🔁 0    💬 1    📌 0
Preview
Release v0.53.0 · medialab/xan Breaking xan partition now normalizes filenames to lowercase to correctly deal with case-insensitive filesystems. xan partition also gets a related -C/--case-sensitive flag. Features Adding all ...

Just released xan v0.53.0 ! A bunch of fixes and new features such as xan map --overwrite and more moonblade functions.

Check out the changelog: github.com/medialab/xan...

19.09.2025 15:42 — 👍 0    🔁 0    💬 0    📌 0
Preview
Recherche prestataire en design et développement de site web dans le cadre du projet RésIn | médialab Sciences Po Le médialab de Sciences Po recherche une entreprise prestataire dans le cadre du projet RésIn pour une mission de refonte du front-office d’un site web.

📣 Le médialab est à la recherche d'une entreprise prestataire en design et développement de site web dans le cadre de la refonte du design et du front-office d’un annuaire.

Retrouvez le cahier des charges et les informations pour candidater ici 👇

11.09.2025 08:21 — 👍 0    🔁 1    💬 0    📌 0
Meme showing Ross Geller from friends pivoting a couch in a staircase.

Meme showing Ross Geller from friends pivoting a couch in a staircase.

Releasing xan v0.52.0, with bunch of new features such as pivoting, better transformations, subcommand execution and ranking aggregations. A bunch of bugfixes and QoL improvements are also included as always. Full changelog: github.com/medialab/xan...

Be sure to pivot correctly!

31.07.2025 07:55 — 👍 1    🔁 0    💬 0    📌 0
Post image

Guillaume Plique (@yomguithereal.bsky.social) will be speaking at #csvconf about "Building CSV-powered tools for social sciences"! Register now: http://csvconfv9.eventbrite.com

28.07.2025 12:45 — 👍 2    🔁 1    💬 0    📌 0
Preview
Retour sur la conférence « Social Science and Generative AI » | médialab Sciences Po Retrouvez en image la conférence « Social Science and Generative AI: Inquiries, Instruments, Consequences » organisée par le médialab le 5 juin 2025. Des intervenants internationaux ont discuté des qu...

Découvrez en rediffusion la conférence "Social Science and Generative AI" organisée par le médialab le 5 juin dernier.

Des intervenants internationaux se sont réunis pour explorer les rôles interconnectés de l'IA générative dans le monde universitaire et la société.

Vidéo disponible ci-dessous 👇

04.07.2025 11:29 — 👍 3    🔁 7    💬 0    📌 1
Preview
Release v0.51.0 · medialab/xan The parallel update. Breaking Dropping undocumented xan index and related interactions (in xan count, xan sample, xan slice & xan split --jobs). Dropping now useless coalesce moonblade function. x...

Just released: xan v0.51.0.

Looooots of new features, bugfixes and a novel approach to CSV file single-pass segmentation for map-reduce-like parallel computation over your data!

Check out the changelog over here: github.com/medialab/xan...

30.06.2025 10:55 — 👍 3    🔁 2    💬 0    📌 0

Soon: xan sample n -§/--cursed!

What is cursed sampling you may ask? It's when you jump randomly in a CSV file like a dark wizard of course :)

15.05.2025 16:44 — 👍 2    🔁 0    💬 0    📌 0

Yup recharts usually does the job™. I think we used it more than once on datascapes.

09.04.2025 15:57 — 👍 0    🔁 0    💬 0    📌 0
The emperor

The emperor

xan hist is one copy paste away

08.04.2025 18:23 — 👍 1    🔁 0    💬 1    📌 0
Preview
Xan - Un outil surpuissant pour manipuler vos fichiers CSV en ligne de commande | Le site de Korben Alors on est en 2025 et y’a encore des gens qui utilisent du CSV comme source de données. Non mais “allo quoi” comme on disait en 2013 ! ...

🔧 Découvrez Xan, l'outil ultime pour dompter vos fichiers CSV en ligne de commande ! Optimisez votre temps 🚀 #CSV #Tech #Productivité

31.03.2025 13:55 — 👍 10    🔁 4    💬 0    📌 1

xan est un fork de xsv maintenu par des fans de l’outil original, qui corrige pas mal de choses et ajoute des fonctionnalités et un langage d’expression ainsi que pas mal de visualisations directement dans le terminal oui :)

31.03.2025 19:15 — 👍 2    🔁 0    💬 1    📌 0
Vue de xan en action

Vue de xan en action

Interface xan

Interface xan

Xan : un outil en CLI Open Source, conçu pour manipuler les CSV développé chez Sciences Po Medialab 🇫🇷

"The CSV magician"

Version actuelle 0.48.0

👉 Le projet : github.com/medialab/xan
👉 Lire l'article "A love letter to the CSV format" : medialab.sciencespo....

31.03.2025 16:28 — 👍 31    🔁 12    💬 3    📌 0

Quoting with some image! Alas the fury!

31.03.2025 11:42 — 👍 1    🔁 0    💬 0    📌 0

But What if you quote a quote? Does it become a quotequote?

31.03.2025 11:41 — 👍 1    🔁 0    💬 2    📌 0

Quoting a test is, in itself, a quote.

31.03.2025 11:40 — 👍 0    🔁 0    💬 0    📌 1

New release of xan (v0.48.0) by the research engineering team of the médialab!

Better scraping, smarter CSV commands — and more.

Check it out ⬇️

28.03.2025 10:03 — 👍 3    🔁 1    💬 0    📌 0

Matching url prefixes is not a trivial task. 1. you must be able to reorder urls to become meaningful hierarchical sequences 2. you need a prefix tree able to find a longest prefix so that matching remains efficient.

I just published a guide about how xan does it here: github.com/medialab/xan...

26.03.2025 16:23 — 👍 0    🔁 0    💬 0    📌 0
Preview
GitHub - medialab/xan: The CSV magician The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.

Just released v0.48.0 of xan, @medialab-scpo.bsky.social CSV wrangling command!

Highlights include better scrape, network, explode & implode commands, a new url-join command and xan search --url-prefix flag to easily match rows on url prefixes!

github.com/medialab/xan...

26.03.2025 10:53 — 👍 4    🔁 2    💬 0    📌 1

Still better than SparQL :)

26.03.2025 07:52 — 👍 1    🔁 0    💬 0    📌 0
Video thumbnail

I found the ultimate CLI tool for processing CSV files! 🔥

🪄✨ xan: The CSV magician.

💯 Supports expressions, parallelism, advanced filtering, sorting, and visualizations.

🦀 Written in Rust & uses @ratatui.rs

⭐ GitHub: github.com/medialab/xan

#rustlang #ratatui #tui #csv #cli #commandline

13.02.2025 11:45 — 👍 21    🔁 5    💬 0    📌 0

Et merci à @jwyg.bsky.social qui nous a soumis l'idée d'élargir l'outil à plus de moteurs !

Vivement un workshop avec le @publicdatalab.bsky.social pour bosser tous ensemble avec ! :)

13.02.2025 10:08 — 👍 2    🔁 1    💬 1    📌 0
Search Engines Bookmarklet

Vous pouvez l'installer et le tester directement en quelques clics depuis la page suivante
medialab.github.io/SearchEngine...

Merci à @jpontoire.bsky.social dont ce fut l'une des nombreuses réalisations au cours de son stage dans l'équipe technique du @medialab-scpo.bsky.social ces 5 derniers mois!

13.02.2025 10:08 — 👍 3    🔁 2    💬 1    📌 0
Un aperçu des menus interactifs que l'outil ajoute dans les pages de moteurs de recherche pour permettre d'en télécharger les données.

Un aperçu des menus interactifs que l'outil ajoute dans les pages de moteurs de recherche pour permettre d'en télécharger les données.

Besoin de scraper des moteurs de recherche ?
On vient de refondre notre vieil outil GoogleBookmarklets :
SearchEnginesBookmarklets permet désormais de collecter en CSV des résultats Google, DuckDuckGo, Qwant, Baidu, Google & DuckDuckGo Images & Google Scholar ! medialab.sciencespo.fr/actu/collect...

13.02.2025 10:08 — 👍 18    🔁 9    💬 1    📌 2
Preview
Accès des chercheurs aux données des plateformes : le médialab contribue à la consultation européenne | médialab Sciences Po Le médialab a répondu au mois de décembre 2024 à la consultation de la Commission Européenne sur l’implémentation du droit d’accès des chercheurs aux données des grandes plateformes en ligne et moteur...

Le médialab a répondu en décembre 2024, à la consultation de @ec.europa.eu abordant l’accès des chercheurs aux données des grandes plateformes en ligne et moteurs de recherche via l’Article 40 du Digital Services Act.

Entre transparence, efficacité et accessibilité : Découvrez notre contribution. ⬇️

10.01.2025 13:59 — 👍 24    🔁 9    💬 0    📌 0
Preview
GitHub - medialab/xan: The CSV magician The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.

Just released v0.39.0 of xan, our CSV cli wrangling tool written in Rust! Now supporting probabilistic methods of computing quantiles, cardinality and top-k in constant memory 🔥

github.com/medialab/xan

09.01.2025 17:06 — 👍 1    🔁 0    💬 0    📌 0
Preview
Le champ des possibles : une enquête collective à Sevran | médialab Sciences Po Robin de Mourat, Clémence Seurat et Thomas Tari présenteront l'ouvrage issu du projet <i>Zone critique – Controverses en action</i> au séminaire du médialab.

Mardi 5/12 à 14h, Robin de Mourat, Clémence Seurat et 
Thomas Tari présenteront leur livre « Le champ des possibles : une enquête collective à Sevranville » au séminaire du #médialab.

Séminaire ouvert à tous ; info et réservation sur medialab.sciencespo.fr/actu/le-cham...

01.12.2023 14:35 — 👍 3    🔁 2    💬 0    📌 0

This here is a test.

10.10.2023 19:04 — 👍 4    🔁 0    💬 0    📌 1

@yomguithereal is following 20 prominent accounts