Welcome to the

PRHLT RESEARCH CENTER

The Pattern Recognition and Human Language Technology (PRHLT) research center is composed by researchers from the Universitat Politècnica de València (UPV) in the areas of Multimodal Interaction, Pattern Recognition, Image Processing (Image Analysis, Computer Vision, Handwritten Text Recognition, Document Analysis) and Language Processing (Speech Recognition and Understanding, Machine Translation, Information Retrieval).

The PRHLT center is an active research entity with important ongoing research projects, technology transfer activities, and research publications.

ÁREAS DE INVESTIGACIÓN

Big data and deep learning

“Machine Learning is the new electricity” Deep Learning is a technique that belongs to the Machine Learning Field. Machine Learning techniques learns from data. Nowadays the amount of data grows exponentially year after year. Therefore machine learning techniques obtain a great potential to solve very complex problems. Big-data is the perfect partner and deep learning techniques are becoming a standard thanks to the hardware and software advances. In PRHLT we have [...]

Leer más

ÁREAS DE INVESTIGACIÓN

Speech processing and dialogue systems

El procesado de habla incluye diferentes aplicaciones, tales como reconocimiento y comprensión del habla, traducción del habla, interacción mediante habla con dispositivos móviles, adaptación a locutor y dominio y reconocimiento multimodal de habla. Las tareas relacionadas con sistemas de diálogo incluyen sistemas de diálogo basados en habla y multimodalidad, modelos estadísticos de diálogo y anotación automática de diálogo.

Leer más

ÁREAS DE INVESTIGACIÓN

Handwritten Text Recognition

Both off-line (document images) and on-line HTR (tablet or e-pen signals) are considered. No prior character or word segmentation is needed. Technology relies on character-level optical models based on Convolutional-Recurrent Neural Networks and Hidden Markov Models, along with Finite-State Lexical and N-Gram Language Models. After model training, for each given text line image, a holistic (“Viterbi”) search provides both an optimal transcription and the corresponding word and character segmentations. Applications: [...]

Leer más

ÁREAS DE INVESTIGACIÓN

Computer vision

General Statistical and Syntactic Pattern Recognition techniques for image analysis and recognition. Some applications: OCR and document analysis, medical diagnosis, biometric identification, image and video retrieval. Relevance-based Image Retrieval Biometrics

Leer más

ÁREAS DE INVESTIGACIÓN

Language translation

Las actividades del grupo de Traducción Automática comenzaron hace algunos años con el uso de modelos de estados finitos para la traducción de voz a voz y la traducción de texto a texto en dominios limitados. Este grupo ha desarrollado una serie de modelos de traducción con sus correspondientes algoritmos de aprendizaje y una serie de prototipos para la traducción de voz y la traducción asistida por ordenador. Actualmente, el grupo [...]

Leer más

ÁREAS DE INVESTIGACIÓN

Natural Language Processing

Social media data analysis: Author profiling, Stance detection, Deceptive opinion detection, Irony detection and sentiment analysis, Mixed-script text analysis, Plagiarism and social copying detection. Author profiling Given a text, what are the author’s traits? The focus is on inferring traits such as gender, age, native language, language variety, and personality on the basis of the stylistic analysis of the author’s texts. This is of interest for areas such [...]

Leer más

Proyectos actuales

Arabic Author Profiling for Cyber-Security

Cyber-security has evolved to a key priority for Qatar and all nations over the world. Malicious actors from anywhere misuse the cyberspace to perpetrate various crimes such as phishing, Cyber-blackmailing, Cyber-bullying, and communicating or planning terrorist attacks using social media. For instance, there is a tendency from these cybercriminals to use similar writing styles in their messages, which makes it possible for security experts to detect and stop these threats [...]

Duración: 4 febrero 2017 hasta 4 febrero 2020
Miembros: P. Rosso
Leer más

Carabela: Indexación probabiliística de colecciones de manuscritos para protección del patrimonio histórico subacuático

Por favor, visitar el Portal del proyecto Carabela. El equipo de Carabela está formado por investigadores de PRHLT y del Centro de Arqueología Subacuática del Instituto Andaluz del Patrimonio Histórico. El objetivo del proyecto es aplicar técnicas que permitan búsquedas textuales en colecciones masivas de manuscritos de los siglos XV-XVI que contienen información clave para identificar pecios [...]

Duración: 30 noviembre 2017 hasta 30 noviembre 2019
Leer más

DeepHealth: Deep-Learning and HPC to Boost Biomedical Applications for Health

Health scientific discovery and innovation are expected to quickly move forward under the so-called “fourth paradigm of science”, which relies on unifying the traditionally separated and heterogeneous high-performance computing and big data analytics environments. Under this paradigm, the DeepHealth project will provide HPC computing power at the service of biomedical applications; and apply Deep Learning (DL) techniques on large and complex biomedical datasets to support new and more efficient ways of [...]

Duración: 1 enero 2019 hasta 31 diciembre 2021
Leer más

IBEM: Indexación y búsqueda de expresiones matemáticas a gran escala en corpus masivos de documentos impresos

En la actualidad existen grandes bases de datos de documentos científicos impresos digitalizados, muchos de los cuales incluyen expresiones matemáticas. La búsqueda de información textual en estos documentos es ya una posibilidad ampliamente explotada por los motores de búsqueda de la exploradores más utilizados. Sin embargo, la búsqueda mediante consultas en forma de expresiones matemáticas de documentos científicos impresos digitalizados en grandes colecciones es un campo apenas explorado. Los planteamientos [...]

Duración: 1 noviembre 2018 hasta 31 octubre 2020
Leer más

Perfilado social de usuarios

La proliferación de las redes sociales y la ingente cantidad de información generada por las mismas (big data) proporcionan una gran oportunidad a las empresas para conocer mejor a sus clientes. Sin embargo, la cantidad de datos es habitualmente tan inabarcable que el reto principal de las compañías radica en seleccionar de todo ese corpus la información útil, aquella que mayor valor les puede aportar. El objetivo principal de este proyecto [...]

Duración: 13 marzo 2019 hasta 13 marzo 2020
Miembros: F. Rangel , P. Rosso
Leer más

HOME: Historia de Europa Medieval

Los manuscritos históricos son los testigos más importantes en la herencia cultural común europea, y se continúan digitalizando masivamente y publicando en grandes archivos y bibliotecas digitales. Su exploración, comprensión y difusión hace necesario el desarrollo de nuevas herramientas para promover el interés del público y hacer uso de esta herencia. Ciertamente, la información contenida en estas imágenes de texto permanece ampliamente inaccesible. Usuarios en general e investigadores esperan cada vez más [...]

Duración: 1 septiembre 2018 hasta 1 septiembre 2020
Leer más

HisClima : Dos Siglos de Datos Climáticos

El objetivo del proyecto es crear una plataforma inteligente que permita extraer información de miles de entradas de cuadernos de bitácora manuscritos que contienen (en un periodo de doscientos años y un amplio rango geográfico), datos sobre condiciones climatológicas diarias que pueden ser de gran utilidad a investigadores del cambio climático.

Duración: 30 abril 2019 hasta 30 abril 2021
Leer más

Últimas noticias

Más noticias

Grados de influencia en Twitter

27.04.2019
El centro de investigación PRHLT desarrollará una herramienta para permitir a Vodafone conocer mejor a sus clientes. La proliferación de las redes sociales y la ingente cantidad de información generada por [...]

Avances en el desarrollo de la plataforma de traducción automática híbrida

22.10.2018
El desarrollo de una plataforma de traducción automática híbrida alcanza su primer gran avance. Su objetivo es la concepción y creación de software avanzado para los procesos de traducción [...]

Colaboración con la empresa PANGEANIC en el desarrollo de una plataforma de traducción automática

11.07.2018
El grupo de Traducción Automática del centro PRHLT está involucrado en el desarrollo de una plataforma de traducción automática basada en redes neuronales (Neural Machine Translation, NMT). Este desarrollo se está [...]

Contacto

PRHLT Research Center
Universitat Politècnica de València
Ciudad Politécnica la Innovación
Edif. 8B Acceso N Planta 0
Camí de Vera, s/n
46022 Valencia (VLC), Spain
(+34) 96 387 81 70
Contact form


Write the text below (required)
captcha