首页
/ CrunchBase 数据导出为 CSV 格式项目教程

CrunchBase 数据导出为 CSV 格式项目教程

2025-04-21 14:39:00作者:宣聪麟

1. 项目目录结构及介绍

项目的主要目录结构如下:

crunchbase-data/
├── .gitignore
├── LICENSE
├── acquisitions.csv
├── additions.csv
├── companies.csv
├── crunchbase-csv.py
├── investments.csv
├── readme.md
├── requirements.txt
├── rounds.csv
  • .gitignore:Git 忽略文件列表,指定在执行 git 命令时应该忽略的文件和目录。
  • LICENSE:项目许可证文件,本项目采用 MIT 许可。
  • acquisitions.csv:收购数据文件,以 CSV 格式存储。
  • additions.csv:新增数据文件,以 CSV 格式存储。
  • companies.csv:公司数据文件,以 CSV 格式存储。
  • crunchbase-csv.py:Python 脚本文件,用于将 CrunchBase 数据从 XLSX 格式转换为 CSV 格式。
  • investments.csv:投资数据文件,以 CSV 格式存储。
  • readme.md:项目自述文件,包含项目信息和说明。
  • requirements.txt:项目依赖文件,列出项目运行所需的 Python 库。
  • rounds.csv:融资轮次数据文件,以 CSV 格式存储。

2. 项目的启动文件介绍

项目的启动文件是 crunchbase-csv.py。该文件是一个 Python 脚本,它使用 openpyxl 库读取 XLSX 文件,并使用 unicodecsv 库将数据写入 CSV 文件。要运行此脚本,请按照以下步骤操作:

  1. 创建一个虚拟环境并激活它:

    virtualenv .venv
    source .venv/bin/activate
    
  2. 安装项目依赖:

    pip install -r requirements.txt
    
  3. 运行脚本,并将 CrunchBase 数据的 XLSX 文件作为参数传递:

    python crunchbase-csv.py crunchbase_export.xlsx
    

3. 项目的配置文件介绍

本项目中的配置主要是通过 requirements.txt 文件来管理的。该文件列出了项目运行所需的外部 Python 库:

openpyxl==3.0.7
unicodecsv==0.14.1

确保在运行 crunchbase-csv.py 脚本之前安装了这些库。如果需要修改或添加新的依赖,只需在 requirements.txt 文件中相应地修改或添加即可。

登录后查看全文
热门项目推荐

项目优选

收起
atomcodeatomcode
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started
Rust
456
83
docsdocs
暂无描述
Dockerfile
691
4.48 K
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
409
329
pytorchpytorch
Ascend Extension for PyTorch
Python
552
675
kernelkernel
deepin linux kernel
C
28
16
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.59 K
930
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
955
931
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
653
232
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.08 K
564
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
C
436
4.44 K