Три проблеми української Вікіпедії — і як їх вирішувати

Публікуємо есе користувача BruneiWMUA про основні проблеми, з якими стикається українська Вікіпедія на етапі свого 20-річчя. У дописі представлений авторський аналіз, який не обов’язково відображає позицію ГО «Вікімедіа Україна» як організації. Запропонувати свій допис до публікації можна написавши на info@wikimedia.org.ua

Українській Вікіпедії 20. Серед 700-800 найбільш активних вікіпедистів чимало таких, хто редагує вже понад 10 років, тобто понад половину її віку. Автор цього допису не виняток. Здається, що Вікіпедія досить інертна, спільнота консервативна, а тому деякі речі лишаються незмінними. Але навіть за ці 10 років наш розділ Вікіпедії сильно змінився. Змінилися й проблеми, з якими ми стикаємося. Спробую оглянути найважливіші, на мою думку.

Найочевидніші зміни — кількісні. Якщо 10 років тому УкрВікі мала 500 тисяч статей, то тепер — 1,3 мільйони. Зростання аж у 2,6 рази. При цьому кількість хоч якось активних користувачів змінилася не сильно, десь у 1,5 рази. Невелика кількість дуже активних користувачів майже не змінюється: нові приходять, старі йдуть.

Графік: Leon II, Perohanych / CC BY-SA 3.0

Звідси проблема номер один: зростає кількість статей на одного користувача. У середньому це 350 статей на людину. Якщо ж деякі користувачі слідкують за 1-10 статтями, то на інших випадає кілька тисяч статей. За таких умов важко говорити навіть про контроль вандалізму: у нас просто нестача людей.

Спробую запропонувати й рішення цієї проблеми. Пропоную навчати людей не стільки писати статті, скільки рецензувати, шукати джерела, обговорювати сумнівні редагування на службових сторінках. До речі, саме на службових сторінках новачки найчастіше натрапляють на непорозуміння з досвідченими користувачами, і добре було б підказати їм основні механізми розв’язання конфліктів.

Друга група змін якраз і пов’язана з поведінкою користувачів. Якщо в далекому 2014 проблемою було чублення користувачів навколо особистих образ та політичних поглядів, то зараз ці проблеми відійшли на другий план. Нові адміни, незнайомі зі старими скандалами, поблокували найбільш конфліктних користувачів: як я й очікував у 2016, вистачило до десятка блокувань. Крім того, чимало заводіїв свар постаршали та відійшли від справ. Натомість, тепер спільнота має складніші виклики. Цілком спокійні та нескандальні люди тихенько собі створюють сотні й тисячі статей. У всій Вікіпедії найбільшого резонансу набула історія користувача шотландського розділу, який створив тисячі статей, не володіючи мовою. Він діяв з найкращих намірів, але все одно зробив величезну шкоду Вікіпедії та мовній спільноті. Найгіршим є те, що коли користувачів мало, а статей багато, таку халепу помічають надто пізно.

Серед найпродуктивніших «шотландців» нашого розділу — користувачі Shynkar і Haida. Обидва також були дуже тихі й неконфліктні, потроху писали статті. Shynkar копіював тексти з невільних джерел, порушуючи авторські права, бо щиро вірив, ніби переказ викривлює інформацію. Допоки йому не обмежили створення нових статей, він наполягав на копіюванні, створивши цим способом, імовірно, понад 1 тисячу статей. Haida започаткував ще більше — понад 19 тисяч статей. Його спосіб був складніший: імовірно він знаходив цікаву йому інформацію іноземними мовами, перекладав її програмою, а далі підставляв схожі за темою джерела, які знаходив в інтернеті. Іноді він вигадував такі джерела, як було зі «Словником-довідником з зоології». Іноді було схоже, що він вигадував і предмет статті, як з боспорськими царями. Проте його дії також, скоріше за все, були викликані добрими намірами.

Ще одним нещодавнім діячем був DoctorNaturopath. На його рахунку близько 200 започаткованих і змінених статей. Він також керувався добрими намірами: наповнював статті найновішими науковими дослідженнями щодо здоров’я людини, обираючи ті, які стверджують користь рослинних і тваринних біомолекул, що їх використовує натуропатія. Єдиним винятком у його діяльності була стаття про валеологію — пострадянську дисципліну, яку не визнають у світовій науці. Під час боротьби навколо цієї статті користувач виявив агресію, що привернуло увагу й до інших його статей. Виявилося, що він просував власні погляди, але для виявлення цього в кожній статті потрібно було переглянути понад сотню спеціалізованих джерел та мати глибокі знання в досить вузькій темі. Попри блокування користувача, зміни в статтях досі наявні та чекають своїх дослідників.

Ось і друга проблема: користувачі створюють сотні статей з порушеннями, які лишаються невиявленими роками, а після виявлення адміни та спільнота не знають, як з цими статтями вчинити. Якщо з копівіо можна працювати машинним способом, то фактчекінг лишається тільки людям. Тим користувачам, яких нам не вистачає — дивись проблему 1.

Які можуть бути рішення? Знову-таки, готувати не вікіписьменників, а вікічитачів. Нам потрібні фактчекери та освічені рецензенти з різних галузей. Їх треба навчити любити читання Вікіпедії, вишукувати помилки. Смаколики, тусовки — щоб вони завжди були десь поруч, навіть якщо зараз непотрібні. Вони навіть можуть не вміти писати статті (і ми їх не будемо цькувати за це!), лише вишукувати помилки. З іншого боку, варто напрацювати в спільноті консенсус щодо визнання помилок. Нехай помилки знайдуть у 100 тисячах статей. Або ми послідовно їх виправляємо, або масово вилучаємо. Адміни мають рішуче дотримуватися домовленого, адже на кону довіра до всього проєкту.

Третя велика проблема народилася близько року тому з поширенням безкоштовних сервісів генерування текстів за допомогою машинного навчання на кшталт ChatGPT та інших. Спільноті ще потрібно виробити стратегію та політики ставлення до подібних сервісів. Але люди вже почали писати з їхньою допомогою тексти, зокрема й до Вікіпедії. Оскільки ці алгоритми навчаються на великих корпусах відкрито доступних текстів, то Вікіпедія сама є важливим джерелом для цих мовних моделей. Отже в певний момент ми стикнемося з тим, що Вікіпедія буде писатися на основі Вікіпедії.

Це заборонено правилами недарма. Адже алгоритми будуть розмножувати наявні вади Вікіпедії. Наприклад, вигаданий факт, внесений людиною у кілька статей, буде виданий алгоритмом як відповідь для написання наступних вікітекстів. Сирі машинні переклади наших користувачів зроблять і без того кострубату українську вимову ChatGPT зовсім кривою. Зможе підпрацювати й у нас «несправжнім шотландцем».

Крім того, подібні чати ставлять увесь сенс існування Вікіпедії — як найбільш загальної та доступної енциклопедичної збірки текстів про світ — під сумнів. Нащо тепер читати десятки статей, коли за 2 хвилини у вигляді діалогу машина дасть текстові відповіді на будь-яке питання? Єдина відповідь, яку я бачу тепер — це збереження Вікіпедії як людської спільноти. На відміну від незрозумілої машини, код якої схований, а шляхи його реалізації незрозумілі навіть розробникам. Не забуваймо й про «галюцинації» цих алгоритмів, які вигадують неіснуючі джерела та роблять помилкові узагальнення, які поки може виявити лише людина.

Тільки живі користувачі Вікіпедії можуть підтримувати цінності нейтральності та надійності інформації. Ми, спільнота, живемо в реальному світі, і здатні порівнювати з ним тексти, виправляючи помилки. Якщо ж машинні алгоритми навчаться робити й це, тоді й Вікіпедія втратить свою актуальність, а нам варто буде зайнятися чимось іншим. А поки цього не сталося, варто знайти вирішення проблеми помилок та упереджень алгоритмів. І знову нам потрібні рецензенти — просунуті читачі-верифікатори.

Можливо, читачі цього тексту запропонують інші рішення наведених проблем. А, може, побачать інші важливі проблеми. У цьому і є сила вікіспільноти — разом робити велику справу. Добре б посилювати ініціативи окремих користувачів взаємодією. Цьому теж потрібно вчитися. А поки — вітаю УкрВікі з ювілеєм! Тримаємося та редагуємо.

Опубліковано у Аналітика | Теґи: , , . | Додати в закладки: постійне посилання на публікацію.

Залишити коментар