Bienvenido al Repositorio Institucional del Concytec

El Repositorio Institucional del Concytec tiene como objetivo permitir el libre acceso a la producción científica institucional, optimizando su visibilidad; así mismo garantizar la preservación y conservación de la información relacionada a la ciencia, tecnología e innovación.



Display.item.jsp


Por favor, utiliza este identificador para citar o enlazar este ítem:
http://hdl.handle.net/20.500.12390/2460


Título: Web Scraping versus Twitter API: A Comparison for a Credibility Analysis
Autor(es): Dongo I. 
Cadinale Y. 
Aguilera A. 
Martínez F. 
Quintero Y. 
Barrios S. 
Resumen: Twitter is one of the most popular information source available on the Web. Thus, there exist many studies focused on analyzing the credibility of the shared information. Most proposals use either Twitter API or web scraping to extract the data to perform such analysis. Both extraction techniques have advantages and disadvantages. In this work, we present a study to evaluate their performance and behavior. The motivation for this research comes from the necessity to know ways to extract online information in order to analyze in real-time the credibility of the content posted on the Web. To do so, we develop a framework which offers both alternatives of data extraction and implements a previously proposed credibility model. Our framework is implemented as a Google Chrome extension able to analyze tweets in real-time. Results report that both methods produce identical credibility values, when a robust normalization process is applied to the text (i.e., tweet). Moreover, concerning the time performance, web scraping is faster than Twitter API, and it is more flexible in terms of obtaining data; however, web scraping is very sensitive to website changes. © 2020 ACM.
Tema: API;Credibility;Twitter;Web Scraping
Editorial: Association for Computing Machinery
Fecha de publicación: 2020
Publicado en: ACM International Conference Proceeding Series 
Financiamiento: 01-2019--FONDECYT-BM 
Tipo de publicación: info:eu-repo/semantics/article
Identificador Handle: http://hdl.handle.net/20.500.12390/2460
DOI: 10.1145/3428757.3429104
Nivel de acceso: info:eu-repo/semantics/closedAccess
Colección:6.1 Proyectos de investigación científica

Registro Dublin Core completo



Páginas vistas

51
marcado en 19-ene-2022

Google ScholarTM

Check

Altmetric

  • Compartir este item
  • QR Code

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.