Il y a clairement des recouvrements oui. Les deux outils ne sont pas designés de la même manière ni avec les mêmes affordances ceci dit. Je pense que xan couvre plus de terrain et permet de produire des visualiations. xan est généralement plus rapide que miller, aussi et sait paralléliser autrement.
23.10.2025 19:42 — 👍 1 🔁 0 💬 0 📌 0
I don't know TEI very well, but if you know something like `xan from tei` would make sense (it might not be tabular enough for it to mean anythin though), let me know. `xan` has been first and foremost geared towards social sciences and digital humanities after all.
21.10.2025 14:28 — 👍 1 🔁 0 💬 0 📌 0
Sorry to eavesdrop here :) but I wonder whether the xan scrape command could take care of a least some subset of this endeavor?
21.10.2025 12:28 — 👍 0 🔁 0 💬 1 📌 0
Recherche prestataire en design et développement de site web dans le cadre du projet RésIn | médialab Sciences Po
Le médialab de Sciences Po recherche une entreprise prestataire dans le cadre du projet RésIn pour une mission de refonte du front-office d’un site web.
📣 Le médialab est à la recherche d'une entreprise prestataire en design et développement de site web dans le cadre de la refonte du design et du front-office d’un annuaire.
Retrouvez le cahier des charges et les informations pour candidater ici 👇
11.09.2025 08:21 — 👍 0 🔁 1 💬 0 📌 0
Meme showing Ross Geller from friends pivoting a couch in a staircase.
Releasing xan v0.52.0, with bunch of new features such as pivoting, better transformations, subcommand execution and ranking aggregations. A bunch of bugfixes and QoL improvements are also included as always. Full changelog: github.com/medialab/xan...
Be sure to pivot correctly!
31.07.2025 07:55 — 👍 1 🔁 0 💬 0 📌 0
Guillaume Plique (@yomguithereal.bsky.social) will be speaking at #csvconf about "Building CSV-powered tools for social sciences"! Register now: http://csvconfv9.eventbrite.com
28.07.2025 12:45 — 👍 2 🔁 1 💬 0 📌 0
Retour sur la conférence « Social Science and Generative AI » | médialab Sciences Po
Retrouvez en image la conférence « Social Science and Generative AI: Inquiries, Instruments, Consequences » organisée par le médialab le 5 juin 2025. Des intervenants internationaux ont discuté des qu...
Découvrez en rediffusion la conférence "Social Science and Generative AI" organisée par le médialab le 5 juin dernier.
Des intervenants internationaux se sont réunis pour explorer les rôles interconnectés de l'IA générative dans le monde universitaire et la société.
Vidéo disponible ci-dessous 👇
04.07.2025 11:29 — 👍 3 🔁 7 💬 0 📌 1
Soon: xan sample n -§/--cursed!
What is cursed sampling you may ask? It's when you jump randomly in a CSV file like a dark wizard of course :)
15.05.2025 16:44 — 👍 2 🔁 0 💬 0 📌 0
Yup recharts usually does the job™. I think we used it more than once on datascapes.
09.04.2025 15:57 — 👍 0 🔁 0 💬 0 📌 0
The emperor
xan hist is one copy paste away
08.04.2025 18:23 — 👍 1 🔁 0 💬 1 📌 0
xan est un fork de xsv maintenu par des fans de l’outil original, qui corrige pas mal de choses et ajoute des fonctionnalités et un langage d’expression ainsi que pas mal de visualisations directement dans le terminal oui :)
31.03.2025 19:15 — 👍 2 🔁 0 💬 1 📌 0
Vue de xan en action
Interface xan
Xan : un outil en CLI Open Source, conçu pour manipuler les CSV développé chez Sciences Po Medialab 🇫🇷
"The CSV magician"
Version actuelle 0.48.0
👉 Le projet : github.com/medialab/xan
👉 Lire l'article "A love letter to the CSV format" : medialab.sciencespo....
31.03.2025 16:28 — 👍 31 🔁 12 💬 3 📌 0
Quoting with some image! Alas the fury!
31.03.2025 11:42 — 👍 1 🔁 0 💬 0 📌 0
But What if you quote a quote? Does it become a quotequote?
31.03.2025 11:41 — 👍 1 🔁 0 💬 2 📌 0
Quoting a test is, in itself, a quote.
31.03.2025 11:40 — 👍 0 🔁 0 💬 0 📌 1
New release of xan (v0.48.0) by the research engineering team of the médialab!
Better scraping, smarter CSV commands — and more.
Check it out ⬇️
28.03.2025 10:03 — 👍 3 🔁 1 💬 0 📌 0
Matching url prefixes is not a trivial task. 1. you must be able to reorder urls to become meaningful hierarchical sequences 2. you need a prefix tree able to find a longest prefix so that matching remains efficient.
I just published a guide about how xan does it here: github.com/medialab/xan...
26.03.2025 16:23 — 👍 0 🔁 0 💬 0 📌 0
GitHub - medialab/xan: The CSV magician
The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.
Just released v0.48.0 of xan, @medialab-scpo.bsky.social CSV wrangling command!
Highlights include better scrape, network, explode & implode commands, a new url-join command and xan search --url-prefix flag to easily match rows on url prefixes!
github.com/medialab/xan...
26.03.2025 10:53 — 👍 4 🔁 2 💬 0 📌 1
Still better than SparQL :)
26.03.2025 07:52 — 👍 1 🔁 0 💬 0 📌 0
I found the ultimate CLI tool for processing CSV files! 🔥
🪄✨ xan: The CSV magician.
💯 Supports expressions, parallelism, advanced filtering, sorting, and visualizations.
🦀 Written in Rust & uses @ratatui.rs
⭐ GitHub: github.com/medialab/xan
#rustlang #ratatui #tui #csv #cli #commandline
13.02.2025 11:45 — 👍 21 🔁 5 💬 0 📌 0
Et merci à @jwyg.bsky.social qui nous a soumis l'idée d'élargir l'outil à plus de moteurs !
Vivement un workshop avec le @publicdatalab.bsky.social pour bosser tous ensemble avec ! :)
13.02.2025 10:08 — 👍 2 🔁 1 💬 1 📌 0
Search Engines Bookmarklet
Vous pouvez l'installer et le tester directement en quelques clics depuis la page suivante
medialab.github.io/SearchEngine...
Merci à @jpontoire.bsky.social dont ce fut l'une des nombreuses réalisations au cours de son stage dans l'équipe technique du @medialab-scpo.bsky.social ces 5 derniers mois!
13.02.2025 10:08 — 👍 3 🔁 2 💬 1 📌 0
Un aperçu des menus interactifs que l'outil ajoute dans les pages de moteurs de recherche pour permettre d'en télécharger les données.
Besoin de scraper des moteurs de recherche ?
On vient de refondre notre vieil outil GoogleBookmarklets :
SearchEnginesBookmarklets permet désormais de collecter en CSV des résultats Google, DuckDuckGo, Qwant, Baidu, Google & DuckDuckGo Images & Google Scholar ! medialab.sciencespo.fr/actu/collect...
13.02.2025 10:08 — 👍 18 🔁 9 💬 1 📌 2
Accès des chercheurs aux données des plateformes : le médialab contribue à la consultation européenne | médialab Sciences Po
Le médialab a répondu au mois de décembre 2024 à la consultation de la Commission Européenne sur l’implémentation du droit d’accès des chercheurs aux données des grandes plateformes en ligne et moteur...
Le médialab a répondu en décembre 2024, à la consultation de @ec.europa.eu abordant l’accès des chercheurs aux données des grandes plateformes en ligne et moteurs de recherche via l’Article 40 du Digital Services Act.
Entre transparence, efficacité et accessibilité : Découvrez notre contribution. ⬇️
10.01.2025 13:59 — 👍 24 🔁 9 💬 0 📌 0
GitHub - medialab/xan: The CSV magician
The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.
Just released v0.39.0 of xan, our CSV cli wrangling tool written in Rust! Now supporting probabilistic methods of computing quantiles, cardinality and top-k in constant memory 🔥
github.com/medialab/xan
09.01.2025 17:06 — 👍 1 🔁 0 💬 0 📌 0
This here is a test.
10.10.2023 19:04 — 👍 4 🔁 0 💬 0 📌 1
Professor of English and Fellow at the Center for Digital Research in the Humanities at the University of Nebraska-Lincoln. Mainly #DigitalHumanities. Blog at https://stephenramsay.net/
Deputy Director of Data Enablement, DWP Digital — Quantum of Sollazzo data newsletter
www.puntofisso.net
www.quantumofsollazzo.com
My main joys in life are:
video streaming, conference organizing
, coding, directing tv, bicycles and cats.
We might have met at srccon, nicar, csvconf, a python conference or at a pyladies meetup.
I’m also a PSF Fellow and Chair of PyCon US 2025-2026
International Network Lead @OKFN by day, fermentista by night. I am interested in #open communities and I 🧡 libraries.
Proud co-organiser of csv,conf & the Open Research Devroom @FOSDEM.
Based in Bologna, j'ai été Brusseles und Hamburgerin for a while.
A community conference for data makers everywhere. csv,conf,v9 will take place on September 10-11, 2025 in Bologna (Italy).
#csvconf #commallama
Ingénieure de recherche CNRS, à l'INIST
📊 Research Data Management - 💻 Omeka S - Plan de gestion de données / Data Management Plan
🎓 PhD (2012-2017) : toponymy 📍 Pisidia (Asia Minor) UCLouvain
PhD Candidate at SciencesPo Paris. Interested in Party Positions, Party Competition, Natural Language Processing, LLMs and rstats. Football love for Hertha BSC and the Pittsburgh Steelers
https://github.com/luissattelmayer
[researcher | data ⇆ archivist ⇆ [ ] ] info. governance + networks + accountability + transparency >>> critical-digital-methods + research @dataunion-erc.bsky.social @lsts-vub.bsky.social
brussels - berlin | [rt/post ≠ endorsement]
Gopher was my first internet browser.
Le web est une ZAD.
J'en parle sur mon blog : www.affordance.info
Et dans mes livres : https://cfeditions.com/ia-cyberespace/
La plateforme ouverte des données publiques françaises. Le meilleur endroit pour trouver ou publier des données. www.data.gouv.fr
Opérée et animée par la Direction interministérielle du numérique.
Le CSO est un laboratoire en sciences sociales reconnu dans les champs de la sociologie économique, des organisations, de l’action publique, des professions, du travail, des mouvements sociaux et du droit.
Journaliste de canapé, “En léger différé” dans Télérama.
https://www.telerama.fr/ma-vie-au-poste/
Passion documentaire
Into creative ML/AI, NLP, data science and digital humanities, narrative, infovis, games, sf & f. Consultant, ds in Residence at Google Arts & Culture. (Lyon, FR) Newsletter arnicas.substack.com.
Researcher Gustave Eiffel University, Stats, Data, Maps and Lego !
Ingénieure de recherche au @cevipof.bsky.social et écoresponsable. Posts pros et persos. Séminaire de méthodologie de Sciences Po MetSem https://metsem.hypotheses.org
Software engineer and artist. SciencesPo médialab alum. Former Parisian 🇫🇷. I like textile art, illustration and code/hacking. Feminist, anti-fascist. Views are my own.
🔗 https://github.com/dheavy