Пошуковий запит
Пошуковий запит — запит, який користувач вводить в пошукову систему, щоб задовольнити свої потреби в інформації. Особливість пошукових запитів полягає в тому, що вони являють собою простий текст або гіпертекст з додатковими пошуковими директивами (наприклад, «і» чи «або»). Пошукові запити суттєво відрізняються від стандартних мов запитів, які регулюються строгими правилами синтаксису як в командних мовах з ключовими словами або позиційними параметрами.
Типи пошукових запитів
Є три основні категорії, які охоплюють більшість пошукових запитів: інформаційні, навігаційні та транзакційні.[1] Хоча ця модель пошуку не була отримана теоретично, класифікація емпірично підтверджується фактичними запитами в пошукових системах.[2]
- Інформаційні запити — запити, які охоплюють широку тему, для яких може бути тисячі подібних результатів.
- Навігаційні запити — запити, які шукають певний вебсайт або його окремі сторінки.
- Транзакційні запити — запити, що відображають намір користувача виконати певну дію, як придбання автомобіля або завантаження певної програми.
Характеристики
Більшість комерційних пошукових систем не розкривають історію пошукових запитів, тому інформацію про те, що шукають користувачі в Інтернеті, важко знайти.[3] Проте в 1998 році явилися перші дослідження на цю тему.[4][5] Пізніше, в 2001 році[6], було проведене та опубліковане дослідження запитів пошукової системи Excite, яке виявило деякі цікаві характеристики веб-пошуку:
- Середня довжина пошукового запиту — 2,4 слова.
- Близько половини користувачів зробили лише один запит, тоді як трохи менше, ніж третина користувачів зробили три або більше унікальних запитів.
- Близько половини користувачів розглянули лише одну або дві сторінки результатів (на кожній сторінці усього 10 результатів).
- Менше 5 % користувачів використовували розширені функції пошуку (наприклад, логічні оператори AND, OR та NOT).
- Три найбільш часто використовувані слова були (порожній пошук), «і» та «секс».
Аналіз пошукових запитів Excite показав, що 19 % запитів містили географічний термін (наприклад, географічні назви, поштові індекси і т. д.).[7] Дослідження також показують, що є передбачувані патерни до того, як користувачі змінюють свої запити.[8]
Вивчення журналів пошукових запитів Yahoo у 2005 році показав, що 33 % запитів від одного користувача були повторні запити і що 87 % часу, користувач натискав на один і той самий результат.[9] Це говорить про те, що багато користувачів використовують повторні запити аби знову знайти одну і ту саму інформацію. Цей висновок підтверджує пост у блозі пошукової системи Bing, де говориться, що 30 % запитів є навігаційними запити.[10]
Крім того, багато досліджень показали, що частотний розподіл слів у пошукових запитах відповідає степеневому закону. Тобто найчастіше використовується невелика група слів, які спостерігаються у великій кількості запитів, в той час як інші слова використовуються рідше й окремо.[11] Цей приклад принципу Парето (або 80-20) дозволяє пошуковим системам використовувати методи оптимізації, такі як індексація або поділ бази даних, кешування і випереджаюча вибірка. Також були проведені дослідження з виявлення лінгвістично-орієнтованих атрибутів, які могли б вказувати на тип пошукового запиту.[12]
В недавньому дослідженні 2011 року було встановлено, що середня довжина запитів з плином часу зростає, й для неанглійських мов цей процес протікає швидше.[13]
Структуровані запити
З пошуковими системами, які підтримують логічні оператори і круглі дужки, є можливим застосування метода, що традиційно використовувався бібліотекарями. Користувач, який шукає документи, які охоплюють кілька тем або аспектів, може використовувати диз'юнкції характерних слів, наприклад, автомобілі OR машини
. Кон'юнкції (за допомогою логічного оператора AND) таких запитів можуть зробити пошук навіть більш потужним й багатогранним.[14]
Посилання
- Broder, A. (2002). A taxonomy of Web search. SIGIR Forum, 36(2), 3–10.
- Jansen, B. J., Booth, D., and Spink, A. (2008) Determining the informational, navigational, and transactional intent of Web queries, Information Processing & Management. 44(3), 1251—1266.
- Dawn Kawamoto and Elinor Mills (2006), AOL apologizes for release of user search data
- Jansen, B. J., Spink, A., Bateman, J., and Saracevic, T. 1998. Real life information retrieval: A study of user queries on the web. SIGIR Forum, 32(1), 5 -17.
- Silverstein, C., Henzinger, M., Marais, H., & Moricz, M. (1999). Analysis of a very large Web search engine query log. SIGIR Forum, 33(1), 6–12.
- Amanda Spink; Dietmar Wolfram; Major B. J. Jansen; Tefko Saracevic (2001). Searching the web: The public and their queries. Journal of the American Society for Information Science and Technology 52 (3): 226–234. doi:10.1002/1097-4571(2000)9999:9999<::AID-ASI1591>3.3.CO;2-I.
- Mark Sanderson & Janet Kohler (2004). Analyzing geographic queries. Proceedings of the Workshop on Geographic Information (SIGIR '04).
- Jansen, B. J., Booth, D. L., & Spink, A. (2009). Patterns of query modification during Web searchin. Journal of the American Society for Information Science and Technology. 60(3), 557—570. 60(7), 1358—1371.
- Jaime Teevan; Eytan Adar; Rosie Jones; Michael Potts (2005). History repeats itself: Repeat Queries in Yahoo's query logs. Proceedings of the 29th Annual ACM Conference on Research and Development in Information Retrieval (SIGIR '06). с. 703–704. doi:10.1145/1148170.1148326.[недоступне посилання з квітня 2019]
- http://www.bing.com/community/site_blogs/b/search/archive/2011/02/10/making-search-yours.aspx
- Ricardo Baeza-Yates (2005). Applications of Web Query Mining. Lecture Notes in Computer Science 3408. Springer Berlin / Heidelberg. с. 7–22. ISBN 978-3-540-25295-5.
- Alejandro Figueroa (2015). Exploring effective features for recognizing the user intent behind web queries. Computers in Industry 68. Elsevier. с. 162–169.
- Mona Taghavi; Ahmed Patel; Nikita Schmidt; Christopher Wills; Yiqi Tew (2011). An analysis of web proxy logs with query distribution pattern approach for search engines. Journal of Computer Standards & Interfaces 34 (1). Elsevier. с. 162–170. doi:10.1016/j.csi.2011.07.001.
- Vojkan Mihajlović; Djoerd Hiemstra; Henk Ernst Blok; Peter M.G. Apers. Exploiting Query Structure and Document Structure to Improve Document Retrieval Effectiveness.