Carlos J. Nusch's Avatar

Carlos J. Nusch

@kharolusiii.bsky.social

📚 NLP · Digital & Computational Humanities desde el Sur 🌎 🎓 Profesor y Licenciado en Letras (UNLP) 🎓 Máster en HD (UNED) 🎓 Doctorando en Informática (UNLP) 🌐 SEDICI, PREBI, CESGI, LIFIA, ISTEC 🔗 https://prebi-sedici.unlp.edu.ar/personal/carlos-nusch/

29 Followers  |  91 Following  |  6 Posts  |  Joined: 21.05.2025  |  1.8427

Latest posts by kharolusiii.bsky.social on Bluesky

Preview
UBA - Humanidades digitales II Encuentro Iberoamericano de Innovación en Tecnologías Digitales: Universidad y sostenibilidad UBA Digital - III Ciclo "Enseñanza universitaria y transformación digital"

El 23 de septiembre estaremos con @kharolusiii.bsky.social y más humanistas digitales organizando el ateneo "Las humanidades digitales ante el giro artificial" que es parte de los eventos de Citep en #UBADIGITAL
sites.google.com/view/uba-dig...

04.09.2025 21:48 — 👍 2    🔁 1    💬 0    📌 0

Ahora que ya todo yace en el pasado,
hasta casi parece que te entregaste
a aquellos deseos - recuerda cómo
brillaban en los ojos que te estaban mirando;
Y cómo temblaban en la voz, por ti, recuerda, cuerpo.

Konstantinos Kavafis

13.08.2025 14:51 — 👍 1    🔁 0    💬 0    📌 0

Recuerda, cuerpo, no solamente cuánto fuiste amado,
ni tan solo los lechos en los que te acostaste,
sino también aquellos deseos que por ti
claros brillaban en los ojos,
y temblaban en la voz - y los frustró
algún fortuito obstáculo.

13.08.2025 14:51 — 👍 0    🔁 0    💬 1    📌 0

Se compararon resultados con la clasificación realizada por humanos 🧑‍💻

📈 Resultados destacados
Bibliotecas → 🔁 ≈95% coincidencia con humanos
mBERT → 🤖 78,7% (vs. Polyglot) y apenas 19,6% (vs. humanos en casos conflictivos)

Se detectaron errores en ambas partes: humanos y herramientas automáticas 🧩

21.05.2025 20:22 — 👍 0    🔁 0    💬 0    📌 0

🔍 ¿Qué hicimos?
Se exportaron 🧾 126.081 registros desde SEDICI
Se aplicaron métodos de detección de idiomas 🧠 zero-shot: langdetect, CLD3, fastText, Polyglot, langid, TextCat
Se entrenó un modelo mBERT multilingüe para mejorar la detección en casos dudosos

21.05.2025 20:22 — 👍 0    🔁 0    💬 1    📌 0

🧐 ¿Por qué importa esto?
El volumen de recursos digitales en los repositorios institucionales dificulta la supervisión manual de los metadatos. Este trabajo se centra en mejorar la calidad del campo "idioma" en los resúmenes del repositorio SEDICI UNLP de la Universidad Nacional de La Plata.

21.05.2025 20:22 — 👍 0    🔁 0    💬 1    📌 0
LinkedIn This link will take you to a page that’s not on LinkedIn

📌 Detección de idiomas como tarea de curaduría de datos en repositorios institucionales
📚📊 Evaluación de bibliotecas disponibles y modelos de lenguaje

Leticia Cagnina Marcelo Errecalde Leandro Antonelli Marisa De Giusti

👉 Leer el documento sedici.unlp.edu.ar/bitstream/ha...

21.05.2025 20:22 — 👍 1    🔁 0    💬 1    📌 0

@kharolusiii is following 20 prominent accounts