Academic Publications

Josiane Mothe; Léa Laporte; Adrian-Gabriel Chifu

Predicting Query Difficulty in IR: Impact of Difficulty Definition Conference

2019 11th International Conference on Knowledge and Systems Engineering, KSE2019 IEEE 2019.

Abstract | Links | BibTeX | Tags: Information Retrieval, Query Difficulty Prediction, Query Features

Adrian-Gabriel Chifu; Léa Laporte; Josiane Mothe; Md Zia Ullah

Query performance prediction focused on summarized letor features Conference

The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval, SIGIR2018 2018.

Abstract | Links | BibTeX | Tags: Letor Features, Post Retrieval Features, Query Difficulty Prediction, Query Features, Query Performance Prediction

Adrian Chifu; Léa Laporte; Josiane Mothe

La prédiction efficace de la difficulté des requêtes : une tâche impossible ? Conference

Conférence francophone en Recherche d'Information et Applications (CORIA 2015), Paris, 2015.

Abstract | Links | BibTeX | Tags: Data Mining, Evaluation, Information Retrieval, Query Difficulty Prediction

@conference{ChifuCORIA2015,

title = {La prédiction efficace de la difficulté des requêtes : une tâche impossible ?},

author = {Adrian Chifu and Léa Laporte and Josiane Mothe},

url = {https://oatao.univ-toulouse.fr/15263/1/chifu_15263.pdf},

year  = {2015},

date = {2015-03-18},

booktitle = {Conférence francophone en Recherche d'Information et Applications (CORIA 2015), Paris},

abstract = {Résumé :



Les moteurs de recherche d’information (RI) retrouvent des réponses quelle que soit la requête, mais certaines requêtes sont difficiles (le système n’obtient pas de bonne performance en termes de mesure de RI). Pour les requêtes difficiles, des traitements ad-hoc doivent être appliqués. Prédire qu’une requête est difficile est donc crucial et différents prédicteurs ont été proposés. Dans cet articlenous étudions la variété de l’information captée par les prédicteurs existants et donc leur non redondance. Par ailleurs, nous montrons que les corrélations entre les prédicteurs et les performance des systèmes donnent peu d’espoir sur la capacité de ces prédicteurs à être réellement efficaces. Enfin, nous étudions la capacité des prédicteurs à prédire les classes de difficulté des requêtes en nous appuyant sur une variété de méthodes exploratoires et d’apprentissage. Nous montrons que malgré les (faibles) corrélations observées avec les mesures de performance, les prédicteurs actuels conduisent à des performances de prédiction variables et sont donc difficilement utilisables dans une application concrète de RI.



Abstract:



Search engines found answers whatever the user query is, but some queries are more difficult than others for the system. For difficult queries, adhoc treatments must be applied. Predicting query difficulty is crucial and different predictors have been proposed. In this paper, we revisit these predictors. First we check the non statistical redundancy of predictors. Then, we show that the correlation between the values of predictors and system performance gives little hope on the ability of these predictors to be effective. Finally, we study the ability of predictors to predict the classes of difficulty by relying on a variety of exploratory and learning methods. We show that despite the (low) correlation with performance measures, current predictors are not robust enough to be used in practical IR applications.},

keywords = {Data Mining, Evaluation, Information Retrieval, Query Difficulty Prediction},

pubstate = {published},

tppubtype = {conference}

}

Close

Résumé :

Les moteurs de recherche d’information (RI) retrouvent des réponses quelle que soit la requête, mais certaines requêtes sont difficiles (le système n’obtient pas de bonne performance en termes de mesure de RI). Pour les requêtes difficiles, des traitements ad-hoc doivent être appliqués. Prédire qu’une requête est difficile est donc crucial et différents prédicteurs ont été proposés. Dans cet articlenous étudions la variété de l’information captée par les prédicteurs existants et donc leur non redondance. Par ailleurs, nous montrons que les corrélations entre les prédicteurs et les performance des systèmes donnent peu d’espoir sur la capacité de ces prédicteurs à être réellement efficaces. Enfin, nous étudions la capacité des prédicteurs à prédire les classes de difficulté des requêtes en nous appuyant sur une variété de méthodes exploratoires et d’apprentissage. Nous montrons que malgré les (faibles) corrélations observées avec les mesures de performance, les prédicteurs actuels conduisent à des performances de prédiction variables et sont donc difficilement utilisables dans une application concrète de RI.

Abstract:

Search engines found answers whatever the user query is, but some queries are more difficult than others for the system. For difficult queries, adhoc treatments must be applied. Predicting query difficulty is crucial and different predictors have been proposed. In this paper, we revisit these predictors. First we check the non statistical redundancy of predictors. Then, we show that the correlation between the values of predictors and system performance gives little hope on the ability of these predictors to be effective. Finally, we study the ability of predictors to predict the classes of difficulty by relying on a variety of exploratory and learning methods. We show that despite the (low) correlation with performance measures, current predictors are not robust enough to be used in practical IR applications.

Close

Arabic	Hebrew	Polish
Bulgarian	Hindi	Portuguese
Catalan	Hmong Daw	Romanian
Chinese Simplified	Hungarian	Russian
Chinese Traditional	Indonesian	Slovak
Czech	Italian	Slovenian
Danish	Japanese	Spanish
Dutch	Klingon	Swedish
English	Korean	Thai
Estonian	Latvian	Turkish
Finnish	Lithuanian	Ukrainian
French	Malay	Urdu
German	Maltese	Vietnamese
Greek	Norwegian	Welsh
Haitian Creole	Persian

2019

Conferences

2018

Conferences

2015

Conferences