IDEAS home Printed from https://ideas.repec.org/a/taf/ginixx/v48y2022i4p678-696.html
   My bibliography  Save this article

Click, click boom: Using Wikipedia data to predict changes in battle-related deaths

Author

Listed:
  • Christian Oswald
  • Daniel Ohrenhofer

Abstract

Data and methods development are key to improve our ability to forecast conflict. Relatively recent data sources such as mobile phone and social media data or images have received widespread attention in conflict research. Oftentimes these do not cover substantial parts of the globe or they are difficult to obtain and manipulate, which makes regular updating challenging. The sometimes vast amounts of data can also be computationally and financially costly. The data source we propose instead is cheap, readily and openly available, and updated in real time, and it provides global coverage: Wikipedia. We argue that the number of country page views can be considered a measure of interest or salience, whereas the number of page changes can be considered a measure of controversy between competing political views. We expect these predictors to be particularly successful in capturing tensions before a conflict escalates. We test our argument by predicting changes in battle-related deaths in Africa on the country-month level. We find evidence that country page views do increase predictive performance while page changes do not. Contrary to our expectation, our model seems to capture long-term trends better than sharp short-term changes.El desarrollo de datos y métodos es fundamental para perfeccionar nuestra habilidad de previsión de conflictos. Las fuentes de datos relativamente nuevas, tales como los datos o las imágenes de los teléfonos celulares y de las redes sociales, han recibido una atención generalizada en la investigación de conflictos. A menudo, dichas fuentes no cubren las partes primordiales del mundo o son difíciles de obtener y manejar, lo que hace que la actualización periódica sea un desafío. Las cantidades de datos, en ocasiones enormes, también pueden ser costosas desde el punto de vista informático y financiero. En su lugar, la fuente de datos que proponemos es económica, está disponible fácil y públicamente, se actualiza en tiempo real y proporciona una cobertura global: Wikipedia. Planteamos que la cantidad de páginas vistas por país puede considerarse una medida de interés o prominencia, mientras que el número de cambios de página puede considerarse una medida de controversia entre las opiniones políticas rivales. Esperamos que estos indicadores tengan especial éxito a la hora de captar las tensiones antes de que el conflicto se intensifique. Ponemos a prueba nuestro argumento prediciendo cambios en las muertes relacionadas con las batallas en África a nivel mensual y por país. Encontramos pruebas de que esas páginas vistas por país aumentan el rendimiento predictivo, mientras que los cambios de página no lo hacen. Al contrario de lo que esperábamos, nuestro modelo parece registrar mejor las tendencias a largo plazo que los cambios bruscos a corto plazo.Les données et le développement des méthodes sont essentiels à l’amélioration de notre capacité à prévoir les conflits. La recherche sur les conflits a étudié avec application des sources de données relativement récentes, telles que celles fournies par les téléphones portables ou les médias sociaux. Néanmoins, dans de nombreux cas, les données obtenues n’englobent pas l’ensemble de la planète. Elles sont parfois difficiles à obtenir et sont délicates à manipuler, ce qui rend difficile toute mise à jour régulière. En outre, du fait de leur quantité, l’analyse de ces données peut être chronophage et coûteuse. Au contraire, la source de données que nous proposons est bon marché, publique et immédiatement disponible, mise à jour en temps réel, et inclut l’ensemble de la planète : Wikipédia. Nous soutenons que le nombre de pages vues par pays permet de mesurer l’intérêt ou l’importance d’un sujet, tandis que le nombre de changements apportés aux pages permet de mesurer le niveau de controverses entre des opinions politiques concurrentes. Nous estimons que ces éléments permettent d’identifier avec succès des tensions avant qu’un conflit n’éclate. Nous vérifions la justesse de nos hypothèses en prédisant des changements en ce qui concerne le nombre de victimes dans des combats en Afrique, par pays et par mois. Nous apportons la preuve que le nombre de pages vues par pays a une valeur prédictive, mais que le nombre de changements apportés aux pages n’en a pas. Contrairement à nos attentes, notre modèle semble permettre d’identifier des tendances de long terme, et non des changements soudains de court terme.

Suggested Citation

  • Christian Oswald & Daniel Ohrenhofer, 2022. "Click, click boom: Using Wikipedia data to predict changes in battle-related deaths," International Interactions, Taylor & Francis Journals, vol. 48(4), pages 678-696, July.
  • Handle: RePEc:taf:ginixx:v:48:y:2022:i:4:p:678-696
    DOI: 10.1080/03050629.2022.2061969
    as

    Download full text from publisher

    File URL: http://hdl.handle.net/10.1080/03050629.2022.2061969
    Download Restriction: Access to full text is restricted to subscribers.

    File URL: https://libkey.io/10.1080/03050629.2022.2061969?utm_source=ideas
    LibKey link: if access is restricted and if your library uses this service, LibKey will redirect you to where you can use your library subscription to access this item
    ---><---

    As the access to this document is restricted, you may want to search for a different version of it.

    More about this item

    Statistics

    Access and download statistics

    Corrections

    All material on this site has been provided by the respective publishers and authors. You can help correct errors and omissions. When requesting a correction, please mention this item's handle: RePEc:taf:ginixx:v:48:y:2022:i:4:p:678-696. See general information about how to correct material in RePEc.

    If you have authored this item and are not yet registered with RePEc, we encourage you to do it here. This allows to link your profile to this item. It also allows you to accept potential citations to this item that we are uncertain about.

    We have no bibliographic references for this item. You can help adding them by using this form .

    If you know of missing items citing this one, you can help us creating those links by adding the relevant references in the same way as above, for each refering item. If you are a registered author of this item, you may also want to check the "citations" tab in your RePEc Author Service profile, as there may be some citations waiting for confirmation.

    For technical questions regarding this item, or to correct its authors, title, abstract, bibliographic or download information, contact: Chris Longhurst (email available below). General contact details of provider: http://www.tandfonline.com/GINI20 .

    Please note that corrections may take a couple of weeks to filter through the various RePEc services.

    IDEAS is a RePEc service. RePEc uses bibliographic data supplied by the respective publishers.