30 жовтня ми провели вебінар про Вікіпедію та інструменти для її дослідження для наукової спільноти.
Подію організували у рамках підготовки до І міжнародної науково-практичної конференції «Вікіпедія та вікіпроєкти у фокусі досліджень», яка пройшла 15 листопада у змішаному форматі — наживо в Києві та онлайн. Переглянути запис можна за посиланням.
На вебінарі Віра Моторко, досвідчена редакторка та адміністраторка українськомовного розділу Вікіпедії, розповіла про особливості Вікіпедії та її спільноти, а також як працюють Вікідані, PetScan і Wikidata Query Service.
Антон Процюк, координатор програм ГО «Вікімедіа Україна», відповів на питання учасників.
У заході взяли участь понад 20 слухачів з Київської, Харківської, Львівської, Вінницької, Дніпропетровської та інших областей.
Запрошуємо подивитися запис онлайн-зустрічі «Як влаштована Вікіпедія: вступ для дослідників» на YouTube, а нижче — ознайомитися із основними тезами з події.
Як працює Вікіпедія і як влаштована її спільнота
Найважливіші факти про Вікіпедію
Технічною основою Вікіпедії є рушій MediaWiki, який дозволяє будь-кому редагувати сторінки без спеціального програмного забезпечення — просто через браузер. Уся інформація в енциклопедії розмічена за допомогою вікірозмітки — спеціального синтаксису для форматування тексту.
Тексти Вікіпедії публікуються на умовах ліцензії Creative Commons Attribution-ShareAlike. Будь-хто може вільно використовувати, змінювати й поширювати матеріали за умови зазначення авторства і поширення на умовах цієї ж ліцензії. (Деякі зображення можуть мати інші ліцензії).
В історії редагувань кожної статті зберігаються всі попередні версії, що дозволяє відстежити внески користувачів, час редагування та розмір змін.
Редагувати можна як із зареєстрованого облікового запису, так і тимчасового. Для повторюваних або масових редагувань можуть застосовуватися боти, які не мають обмежень за швидкістю.
Вікіпедія не вимагає електронної пошти під час реєстрації й не збирає персональні дані користувачів. Платформа лише тимчасово зберігає технічну інформацію — мову інтерфейсу, IP-адреси, історію пошуку й переглядів, які видаляються через 90 днів.
Цікаві деталі про вікіспільноту
У Вікіпедії редактором вважається будь-хто, хто зробив бодай одне редагування. У цьому сенсі «редактор» — не посада, а роль. Взаємозамінно використовуються терміни «редактор», «дописувач», «користувач».
У Вікіпедії є волонтери з розширеними правами, які допомагають підтримувати її надійною — наприклад, адміністратори та патрульні обираються шляхом голосування. Процедура та правила відбору різняться залежно від мовного розділу.
Базові технічні права (зокрема, завантаження файлів) користувач отримує автоматично через кілька днів активності.
Дані дослідження Community Insights 2024 свідчать, що більшість активних редакторів мають вищу освіту, а серед новачків переважає молодь. Частка жінок у спільноті становить лише близько 14%.

Корисні посилання:
- Стислі відеоінструкції, які детальніше розповідають, як влаштована Вікіпедія
- Статистика Вікімедіа — для перегляду графіків, динаміки редагувань і переглядів з можливістю завантаження даних.
Інструменти дослідження Вікіпедії
Вікідані
Вікідані — це вільна, багатомовна база даних, яка підтримує Вікіпедію та інші вікіпроєкти. Серед її функцій — централізоване зберігання інформації (текстуальної, медіа), яка використовується у мовних розділах Вікіпедії.
Цей репозиторій структурованих даних є однією з найбільших баз даних про все на світі: від людей і країн до мистецтва та літератури. За допомогою Вікіданих користувачі мають можливість автоматично формувати набір даних за визначеними критеріями.
Вікідані складаються з елементів (англ. items) — відповідників статтям у Вікіпедії (наприклад, елемент Q2041207 — про українську художницю і дисидентку Аллу Горську). Елементи містять властивості (англ. property) — конкретну характеристику (наприклад, громадянство і дата народження), що має значення (англ. value) (наприклад, Україна і 18 вересня 1929 р.). Властивість і його значення формують твердження (англ. statement) — дані, що збираються у відповідному розділі елемента Вікіданих.
Кожен елемент Вікіданих містить список статей у Вікіпедії про цей предмет усіма мовами.
Коли ви створюєте нову статтю у Вікіпедії, обов’язково потрібно додати посилання на неї до відповідного елемента Вікіданих.
У статті Вікіпедії відповідний елемент Вікіданих можна знайти через розділ Інструменти → Вікідані (як на скриншоті).

При використанні інструменту перекладу статті з іншого мовного розділу потрібна інформація для Вікіданих додається автоматично.
- Докладніше про Вікідані та як їх редагувати — у цьому відео.
PetScan
Одним із найпотужніших інструментів для дослідників є PetScan — платформа, що дозволяє виконувати пошук статей за різними критеріями.
У ній можна налаштувати, звідки брати дані (наприклад, з певного мовного розділу Вікіпедії) і який результат бажано отримати. Пошук можна здійснювати за категоріями або їхнім перетином — наприклад, знайти всі статті, які одночасно належать до категорій «Українські письменники» та «Жінки ХХ століття».
PetScan дозволяє враховувати підкатегорії (так звана «глибина пошуку»). Наприклад, якщо виставити глибину 1, інструмент шукатиме не лише у вибраній категорії, а й у її підкатегоріях; при глибині 2 — також і у підкатегоріях її підкатегорій і так далі.
Цей параметр можна варіювати залежно від потреби — іноді достатньо мінімальної глибини (0), а іноді варто експериментувати, встановлюючи навіть до 6 рівнів.

Результат пошуку в PetScan напряму залежить від якості вхідних даних, тому для дослідження важливо спершу розібратися, як побудована категорійна структура у Вікіпедії. Це допомагає зрозуміти, наскільки повним буде отриманий результат.
PetScan дає змогу застосовувати додаткові фільтри за розміром статей, наявністю шаблонів, типом сторінок (наприклад, лише основні статті або сторінки обговорень) тощо.
Вкладка «Шаблони й посилання» дозволяє, наприклад, шукати статті, перекладені з інших мовних розділів, або визначати ті, що можуть потребувати оновлення. Такі пошуки часто використовуються під час тематичних вікіпроєктів для виявлення прогалин в українському мовному розділі Вікіпедії.

Якщо дослідник уже має власний список статей, його можна імпортувати до PetScan для подальшої обробки — це зручно, коли йдеться про аналіз чітко визначеного корпусу текстів.
Також можливий пошук за назвами елементів Вікіданих.
Дані можна отримати у різних форматах — наприклад, у форматі CSV, що спрощує подальшу роботу в табличних редакторах.
Корисні посилання:
Wikidata Query Service
Це інструмент для роботи з Вікіданими для складних пошукових запитів та отримання результатів у різних форматах.
На відміну від PetScan, який працює також зі сторінками Вікіпедії, Wikidata Query Service дає змогу напряму взаємодіяти з елементами Вікіданих.
Сервіс використовує мову запитів SPARQL, що дає можливість точно формулювати запити та фільтрувати дані за властивостями елементів.
Він дозволяє фільтрувати елементи за певними категоріями чи ознаками — за країною, типом об’єкта, періодом, наявністю зображення чи координат. Користувач також може обмежувати кількість результатів.
Результати запиту можна візуалізувати безпосередньо у сервісі: як таблицю, діаграму тощо.
Корисні посилання:
Дякуємо всім, хто долучився до вебінару! Слідкуйте за нашим сайтом і соцмережами, щоб бути в курсі подій від ГО «Вікімедіа Україна»!