WebCite

WebCite інтернет-сервіс, що виконує архівування веб-сторінок за запитом. Згодом на заархівовану сторінку можна послатися через URL. Користувачі мають можливість отримати архівну сторінку в будь-який момент і без обмежень, до того ж не важливий статус й стан оригінальної веб-сторінки, з якої була зроблена архівна копія. Таке архівування особливо важливо в академічному контексті. WebCite є некомерційним консорціумом, який підтримується видавцями та редакторами, і може використовуватися будь-якими бажаючими безкоштовно.

WebCite
Логотип
Посилання www.webcitation.org
Гасло (девіз) Зберігаючи для нащадків
Комерційний ні
Тип архів, вебсайт
Мови англійська
Власник Торонтський університет
Автор Гюнтер Айзенбах
Започатковано 1998
Стан онлайн
Рейтинг Alexa 98,187 (August 2015)[1]
 WebCite у Вікісховищі

На відміну від проекту «Архів Інтернету», WebCite не використовує роботів для автоматичної архівації всіх підряд веб-сторінок. WebCite архівує сторінки тільки у відповідь на прямий запит користувача. WebCite архівує весь контент на сторінці — HTML, PDF, таблиці стилів, JavaScript і зображення. WebCite також архівує метадані про архівуємі ресурси, такі як час доступу, MIME тип та довжину контенту. Ці метадані корисні для встановлення автентичності та походження архівованих даних.

WebCite є членом «англ. International Internet Preservation Consortium»[2]..

Історія

Задуманий в 1997 році Гюнтером Айзенбахом (англ. Gunther Eysenbach), WebCite був публічно описаний в наступному році, коли в статтях про контроль якості Інтернету з'явилися заяви, що подібний сервіс може вимірювати інтенсивність цитування веб-сторінок[3]. У тому ж році був здійснений пілотний запуск сервісу за адресою webcite.net (див. архівні скріншоти «WebCite» через «Wayback Machine» архівовані 3 лютого 1999 р.). Незабаром після цього на ринок вийшли «Google» й «Архів Інтернету», що зменшило потребу в сервісі типу WebCite.

Ідея WebCite була відроджена в 2003 р., коли в дослідженні, опублікованому в журналі «Science», були зроблені висновки, що до сих пір не існує адекватного та відповідного рішення для архівації веб-сторінок[4]. «Архів Інтернету» і «Google» не надають архівацію «за запитом» користувача, й вони не мають необхідного інтерфейсу для наукових журналів і видавництв, який би дозволяв автоматизувати архівацію цитованих посилань. На 2008 рік понад 200 журналів почали повсякденно використовувати WebCite[5].

Лоуренс Лессіг, американський академік, який досліджує теми авторського права та технологій, використовував WebCite в своєму «amicus brief» в судовому процесі англ. MGM Studios, Inc. v. Grokster, Ltd., який розглядався у Верховному суді США[6].

Відключення

Відключення в червні-липні 2009 року

У червні 2009 р. процес додавання до архіву WebCite нових сторінок був призупинений. 19 червня створювач WebCite написав, що збільшене навантаження на сервера є наслідком роботи бота «WebCiteBOT», який працював в Англійській Вікіпедії. Тому WebCite був переведений на новий сервер, й під час «перекладу» сервіс був недоступний[7]. Станом на кінець червня 2009 року WebCite став повністю недоступний, посилання на раніше заархівовані сторінки не працювали. Повне відновлення функціональності сталося на другому тижні липня 2009 року.

Відключення в 2013 році

У серпні 2013 р сайт кілька днів не працював. У 2013 р. проект переживав труднощі з фінансуванням й оголосив збірку коштів[8]. Якщо б не вдалося зібрати необхідну суму (22,5 тис. доларів[8]), WebCite припинив архівацію з грудня 2013 року.

Відключення в 2014 році

В кінці січня та першій половині лютого 2014 р. сайт не працював. У грудні були доступні старі посилання, проте кешування нових було неможливе через нестачу вільного місця. В кінці року проблему вдалося вирішити й сервіс працював в штатному режимі знову.

Порядок архівації

WebCite дозволяє робити архівацію за запитом (англ. On-demand). Він не використовує веб-краулерів, сторінки архівуються тільки на прямий запит користувача.

Щоб ініціювати кешування й архівування сторінки, автор може використовувати спеціальне меню на сайті або створити спеціальний букмарклет, завдяки якому можливо переходити на заархівовану сторінку за допомогою простого «кліка» на відповідній закладці.

Заархівована на сервері WebCite сторінка доступна через дві різні веб-адреси (URL): довгий і укорочений. Довга веб-адреса містить в собі URL оригінальної (архівованої) сторінки та дату архівації. Використовується така схема:

http://webcitation.org/query?url=URL&date=DATE

, де URL є URL-адресою оригінальної сторінки, яка піддалася архівуванню, а DATE є датою архівації.
Наприклад:

http://webcitation.org/query?url=http%3A%2F%2Fen.wikipedia.org%2Fwiki%2FMain_Page&date=2008-03-04

Інша, скорочена форма не містить оригінальної URL-адреси й дати, але значно коротше, ніж довга форма. Наприклад, скорочена форма вищенаведеної сторінки буде наступною:

http://webcitation.org/5W56XTY5h

І довга, і коротка форма, яка наведена як приклад, посилається на ту ж саму сторінку: https://en.wikipedia.org/wiki/Main_Page, що була архівована 4 березня 2008 року.

Форма архівації на сторінці http://www.webcitation.org/archive (на головній сторінці WebSite за адресою http://www.webcitation.org натиснувши на «ARCHIVE» у верхній частині екрану). Для заповнення обов'язкові є лише перші два поля цієї форми.

  • Перше поле: «URL to Archive [url]». У нього вводять повний URL (веб-адресу) сторінки, яку потрібно заархівувати.
  • Друге поле: «Your (citing author) E-mail Address [email]». У нього вводять адресу електронної пошти, на яку WebCite може надіслати повідомлення про результат архівації. Якщо архівація успішна, тоді в листі надходить посилання на заархівовану копію оригінальної сторінки. WebCite використовує поштові адреси користувачів тільки для надсилання звітів про результати архівації, не використовує їх в інших цілей (напр. реклама і спам).

Всі наступні поля не обов'язкові для заповнення, проте їх рекомендують заповнити. Інформація з них використовується як метадані та зберігається в архіві WebCite разом з архівною копією. Якщо для якогось поля немає інформації, наприклад невідомий автор або дата публікації (див. опис полів нижче), то відповідні поля залишаються незаповненими.

  • В поле «Title» вводять назву матеріалу, який розміщений на архівуємій сторінці.
  • В поле «Author (s)» вводять ім'я автора (імена авторів) цього матеріалу в форматі «Прізвище, Ім'я»; якщо авторів декілька, розділяють їх імена крапкою з комою.
  • В поле «Cited Author's E-mail» вводять електронну адресу автора (електронні адреси авторів) матеріалу.
  • В поле «Publisher» вводять назву сайту або організації, на сайті якої розміщена архівована веб-сторінка.
  • В поле «Date» вводять дату публікації матеріалу, якщо вона відома, з максимальною точністю аж до дня в форматі рррр-мм-дд (наприклад, 1998-10-06). Якщо день невідомий, а відомий тільки місяць і рік, використовують формат рррр-мм (наприклад, 1998-10), а якщо відомий тільки рік, використовують рррр (наприклад, 1998). Якщо дата взагалі невідома, залишають поле порожнім.
  • В поле «Subject Keywords» вводять одне або кілька ключових слів для матеріалу, який розміщений на архівованій сторінці.

Коли поля заповнені, натискають кнопку «Submit». Через якийсь час користувачеві буде показана інша сторінка, на якій буде інформація про результат архівування.

Використання

До прикладу в шаблоні {{cite web}} є два параметри, спеціально призначені для архівних посилань: archiveurl і archivedate. У першому параметрі вказують власне посилання на архівну копію, в довгій або укороченій формі. У другому параметрі вказують дату архівації, тобто того дня, коли було зроблено веб-архівування.

Модель бізнесу

Слово WebCite є зареєстрованою торговою маркою[9].

WebCite не бере гроші з будь-яких користувачів сервісу[10]. WebCite отримує дохід від пожертвувань видавців, які хочуть, щоб «їх публікації були проаналізовані та цитованими через веб-архів»[11]. На початку своєї роботи WebCite отримував гроші від Торонтського університету[12].

Восени 2013 р. велися переговори про можливість створення комерційного сервісу на базі WebCite[13].

Авторські права

WebCite підтримує правову позицію, згідно якої його архівна діяльність допускається доктринами сумлінного використання та наявної ліцензії. Для підтримки аргументу про сумлінне використання WebCite вказує, що його архівні копії веб-сторінок є трансформативними творами (англ. Transformativeness), вони є суспільно-корисними для наукових досліджень і не завдають шкоди ринковій вартості будь-якій праці, що охороняється авторським правом. WebCite підкреслює, що кешування та архівування веб-сторінок не може визначатись як порушення авторського права, тому що власник оригінальної сторінки має право вимагати прибрати її з архіву[2].

19 січня 2009р. відбувся судовий процес «англ. Field vs Google» (CV-S-04-0413-RCJ-LRL), що стосувався процесу кешування веб-сторінок компанією «Google». У результаті Окружний суд Невади в США (англ. United States District Court for the District of Nevada) в судовому рішенні постановив, що кешування веб-сторінок не є порушенням авторського права[2].

За вимогами правовласників WebCite видаляє сторінки з публічного доступу, поміщаючи їх в «темний архів» (англ. Dark archive) доступ до якого можна отримати на платній основі ($200 за 5 сторінок плюс $100 за кожні наступні 10 сторінок)[14].

Див. також

Примітки

  1. Webcitation.org Site Info. Alexa Internet. Процитовано 15 серпня 2015. (англ.)
  2. WebCite® Consortium FAQ. www.webcitation.org. WebCite. (англ.)
  3. Eysenbach, Gunther; Diepgen, Thomas L. (28 листопада 1998). Towards quality management of medical information on the internet: evaluation, labelling, and filtering of information. British Medical Journal (London: BMJ Publishing Group Ltd) 317 (7171): 1496–1502. ISSN 0959-8146. OCLC 206118688. PMC 1114339. PMID 9831581. BL Shelfmark 2330.000000. Процитовано 27 лютого 2008.(англ.)
  4. Dellavalle, Robert P; Hester, Eric J; Heilig, Lauren F; Drake, Amanda L; Kuntzman, Jeff W; Graber, Marla; Schilling, Lisa M (31 жовтня 2003). Going, Going, Gone: Lost Internet References. Science (Washington, D.C.: American Association for the Advancement of Science) 302 (5646): 787–788. ISSN 0036-8075. OCLC 211169635. PMID 14593153. doi:10.1126/science.1088234. BL Shelfmark 8130.000000. Процитовано 27 лютого 2008. (англ.)
  5. Eysenbach, Gunther; Trudel, Mathieu (2005). Going, Going, Still There: Using the WebCite Service to Permanently Archive Cited Web Pages. Journal of Medical Internet Research (Toronto: Centre for Global eHealth Innovation at the University Health Network) 7 (5): e60. ISSN 1438-8871. OCLC 107198227. PMC 1550686. PMID 16403724. doi:10.2196/jmir.7.5.e60. Процитовано 27 лютого 2008. (англ.)
  6. Cohen, Norm (29 січня 2007). Courts Turn to Wikipedia, but Selectively. New York Times. (англ.)
  7. Gunther Eysenbach — Twitter update (англ.)
  8. Gunther Eysenbach. Fund WebCite (http://www.webcitation.org). FundRazr. Процитовано 4 серпня 2013. (англ.)
  9. WebCite Legal and Copyright Information. WebCite Consortium. Процитовано 16 червня 2009. (англ.)
  10. WebCite Member List. WebCite Consortium. Процитовано 16 червня 2009. «Membership is currently free» (англ.)
  11. WebCite Frequently Asked Questions. WebCite Consortium. Процитовано 16 червня 2009. (англ.)
  12. WebCite Frequently Asked Questions – Who owns and runs WebCite at the moment?. WebCite Consortium. Процитовано 16 червня 2009. «WebCite has been incubated and is still hosted at the University of Toronto / University Health Network's Centre for Global eHealth Innovation.» (англ.)
  13. Conversation between GiveWell and Webcite on 4/10/13. GiveWell. Процитовано 18 жовтня 2009. «Dr. Eysenbach is trying to decide whether Webcite should continue as a non-profit project or a business with revenue streams built into the system.» (англ.)
  14. WebCite takedown requests policy (англ.)

Джерела

Посилання

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.