Completado

Script en Python para armar un corpus recuperando textos de discusiones parlamentarias

Hola,

Para un proyecto académico, necesito obtener un script en Python para armar un Corpus a partir de los textos taquigráficos de discusiones parlamentarias (carpeta de archivos en PDF y HTML) para una persona específica (SEÑOR XXX), ingresando el nombre de esa persona.

Todos los textos están formateados de la misma manera:

SEÑOR AAA (NOMBRE de una persona): « texto taquigráfico sobre lo hablado en la sesión »

SEÑOR BBB (NOMBRE de otra persona que responde): « texto taquigráfico sobre la respuesta en la sesión »

SEÑOR AAA etc…

Adjunto algunos archivos como ejemplo.

Resumen: necesito recuperar de una carpeta de archivos todo lo que dijo una persona (SEÑOR XXX) de diferentes archivos texto y guardarlo en un archivo separado de texto.

Habilidades: Python, Expresiones regulares

Ver más: 3dsmax script perl python, como funciona reverse dentro de script en javascript, convertir de xls xml en python, convertisseur php en python, dialer en python, hacer script en centos, output sql script file python, redirect output sql script file python, script hi5 python, script mailer python, linux script perl python, formatear textos pdf html para virtuemart, perl script convert python script, freelance especialista en python en madrid, boots en python free lance, botte free lance marron en python, bottes en python femme free lance, bottes free lance geronimo en python

Información del empleador:
( 14 comentarios ) Barcelona, Spain

Nº del proyecto: #30818194

Adjudicado a:

novadragonsoftwa

Saludos, tengo mas de 6 años de experiencia en el área. Ya he trabajado manipulando y extrayendo datos de archivos pdf, y se que hacer en su caso para solucionarlo de forma rápida y eficiente. Espero podamos trabajar j Más

$30 USD en 2 días
(6 comentarios)
4.0

2 freelancers están ofertando un promedio de $30 por este trabajo

InstantCreate

I have read your job description and assure you that I am a perfect fit for the job for Script en Python para armar un corpus recuperando textos de discusiones parlamentarias I am well versed in various types of grap Más

$30 USD en 1 día
(2 comentarios)
2.8