Twint 项目使用教程

2026-01-16 09:45:58作者：滕妙奇

An advanced Twitter scraping & OSINT tool written in Python that doesn't use Twitter's API, allowing you to scrape a user's followers, following, Tweets and more while evading most API limitations.

项目地址：https://gitcode.com/gh_mirrors/tw/twint

项目介绍

Twint 是一个用 Python 编写的先进 Twitter 抓取工具，允许从 Twitter 个人资料中抓取推文，而无需使用 Twitter 的 API。Twint 利用 Twitter 的搜索操作符，让您可以抓取特定用户的推文、与某些主题、标签和趋势相关的推文，或从推文中筛选出敏感信息，如电子邮件和电话号码。Twint 还通过特殊查询到 Twitter，允许您抓取 Twitter 用户的关注者、用户喜欢的推文以及他们关注的人，而无需任何认证 API、Selenium 或浏览器仿真。

项目快速启动

安装 Twint

首先，您需要安装 Twint。可以通过 pip 安装：

pip install twint

基本使用示例

以下是一些基本的使用示例，帮助您理解 Twint 的基本操作：

抓取某个用户的所有推文（不包括转推，但包括回复）：

import twint

# 配置
c = twint.Config()
c.Username = "realDonaldTrump"

# 运行
twint.run.Search(c)

抓取包含特定关键词的推文：

import twint

# 配置
c = twint.Config()
c.Search = "pineapple"

# 运行
twint.run.Search(c)

抓取某个用户在特定时间范围内的推文：

import twint

# 配置
c = twint.Config()
c.Username = "realDonaldTrump"
c.Since = "2015-12-20"

# 运行
twint.run.Search(c)

应用案例和最佳实践

案例一：舆情分析

使用 Twint 抓取特定话题的推文，进行情感分析，以了解公众对该话题的看法。

import twint

# 配置
c = twint.Config()
c.Search = "#COVID19"
c.Limit = 100
c.Store_csv = True
c.Output = "covid19_tweets.csv"

# 运行
twint.run.Search(c)

案例二：用户行为分析

抓取某个用户的关注者和他们喜欢的推文，分析用户行为模式。

import twint

# 配置
c = twint.Config()
c.Username = "realDonaldTrump"
c.Favorites = True

# 运行
twint.run.Favorites(c)

典型生态项目

1. Spark Optimus

Spark Optimus 是一个用于快速数据处理的库，结合 Twint 可以快速处理和分析大量推文数据。

2. Kafka 和 Neo4j

将 Twint 抓取的推文数据加载到 Kafka 中，然后使用 Neo4j 进行图数据库分析，以发现推文之间的关联和模式。

通过这些生态项目的结合使用，可以更深入地挖掘和分析 Twitter 数据，为各种研究和应用提供强大的数据支持。

twint

An advanced Twitter scraping & OSINT tool written in Python that doesn't use Twitter's API, allowing you to scrape a user's followers, following, Tweets and more while evading most API limitations.

项目地址：https://gitcode.com/gh_mirrors/tw/twint

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

271