探索音乐宝藏 —— Spotipy，你的私人音乐助手

2026-01-17 09:14:35作者：苗圣禹Peter

引言：为什么选择Spotipy？

还在为如何通过代码访问Spotify的海量音乐数据而烦恼吗？想要构建个性化的音乐推荐系统、分析用户听歌习惯，或者开发创新的音乐应用吗？Spotipy正是你需要的解决方案！

Spotipy是一个轻量级的Python库，专门为Spotify Web API设计。它提供了完整的API访问能力，让你能够轻松地与Spotify的音乐生态系统进行交互。无论你是音乐爱好者、数据分析师还是应用开发者，Spotipy都能成为你探索音乐世界的强大工具。

读完本文，你将掌握：

Spotipy的核心功能和架构设计
完整的安装和配置流程
多种认证方式的实现方法
丰富的API调用示例和最佳实践
高级功能和应用场景探索

1. Spotipy核心架构解析

1.1 模块化设计

Spotipy采用模块化的设计理念，将功能清晰地划分为几个核心模块：

classDiagram
    class SpotifyClient {
        +track()
        +artist()
        +search()
        +playlist()
        +user_operations()
        +player_control()
    }
    
    class OAuth2 {
        +SpotifyClientCredentials
        +SpotifyOAuth
        +SpotifyPKCE
    }
    
    class CacheHandler {
        +MemoryCacheHandler
        +FileCacheHandler
    }
    
    class Util {
        +prompt_for_user_token()
        +normalize_scope()
    }
    
    SpotifyClient --> OAuth2 : 使用
    SpotifyClient --> CacheHandler : 使用
    OAuth2 --> Util : 依赖

1.2 认证机制对比

Spotipy支持多种认证方式，满足不同场景的需求：

认证类型	适用场景	权限范围	复杂度
Client Credentials	服务器端应用，无需用户交互	只读公共数据	⭐⭐
Authorization Code	Web应用，需要用户授权	完整用户权限	⭐⭐⭐⭐
PKCE (Proof Key for Code Exchange)	移动端和单页应用	完整用户权限	⭐⭐⭐

2. 环境搭建与配置

2.1 安装Spotipy

# 使用pip安装
pip install spotipy

# 或者使用conda
conda install -c conda-forge spotipy

# 升级到最新版本
pip install spotipy --upgrade

2.2 Spotify开发者账号配置

访问 Spotify开发者仪表板
创建新应用，获取Client ID和Client Secret
设置重定向URI（如：http://localhost:8080/callback）
记录重要的凭据信息

2.3 环境变量配置

建议使用环境变量来管理敏感信息：

# 在终端中设置环境变量
export SPOTIPY_CLIENT_ID='your_client_id'
export SPOTIPY_CLIENT_SECRET='your_client_secret'
export SPOTIPY_REDIRECT_URI='http://localhost:8080/callback'

或者在Python代码中直接配置：

import os
os.environ['SPOTIPY_CLIENT_ID'] = 'your_client_id'
os.environ['SPOTIPY_CLIENT_SECRET'] = 'your_client_secret'
os.environ['SPOTIPY_REDIRECT_URI'] = 'http://localhost:8080/callback'

3. 核心功能实战指南

3.1 基础搜索功能

import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

# 客户端认证（无需用户交互）
sp = spotipy.Spotify(auth_manager=SpotifyClientCredentials())

# 搜索歌曲
def search_tracks(query, limit=10):
    results = sp.search(q=query, limit=limit, type='track')
    tracks = results['tracks']['items']
    
    print(f"找到 {len(tracks)} 首相关歌曲:")
    for idx, track in enumerate(tracks, 1):
        artists = ", ".join([artist['name'] for artist in track['artists']])
        print(f"{idx}. {track['name']} - {artists}")
    
    return tracks

# 搜索艺术家
def search_artists(query, limit=5):
    results = sp.search(q=query, limit=limit, type='artist')
    artists = results['artists']['items']
    
    print(f"找到 {len(artists)} 位相关艺术家:")
    for idx, artist in enumerate(artists, 1):
        print(f"{idx}. {artist['name']} - 粉丝数: {artist['followers']['total']:,}")
    
    return artists

# 示例使用
search_tracks("周杰伦")
search_artists("Taylor Swift")

3.2 用户认证与个性化功能

import spotipy
from spotipy.oauth2 import SpotifyOAuth

# 用户认证（需要浏览器交互）
sp = spotipy.Spotify(auth_manager=SpotifyOAuth(
    scope="user-library-read user-top-read user-read-recently-played"
))

def get_user_profile():
    """获取当前用户信息"""
    user = sp.current_user()
    print(f"用户名: {user['display_name']}")
    print(f"邮箱: {user['email']}")
    print(f"国家: {user['country']}")
    print(f"产品类型: {user['product']}")
    return user

def get_recently_played(limit=20):
    """获取最近播放的歌曲"""
    results = sp.current_user_recently_played(limit=limit)
    tracks = results['items']
    
    print("最近播放的歌曲:")
    for idx, item in enumerate(tracks, 1):
        track = item['track']
        artists = ", ".join([artist['name'] for artist in track['artists']])
        played_at = item['played_at'][:10]  # 只显示日期
        print(f"{idx}. {track['name']} - {artists} (播放于: {played_at})")
    
    return tracks

def get_top_tracks(time_range='medium_term', limit=10):
    """获取用户最常听的歌曲"""
    results = sp.current_user_top_tracks(
        limit=limit, 
        time_range=time_range
    )
    tracks = results['items']
    
    time_range_map = {
        'short_term': '最近4周',
        'medium_term': '最近6个月',
        'long_term': '所有时间'
    }
    
    print(f"你的{time_range_map[time_range]}最爱歌曲:")
    for idx, track in enumerate(tracks, 1):
        artists = ", ".join([artist['name'] for artist in track['artists']])
        print(f"{idx}. {track['name']} - {artists}")
    
    return tracks

# 使用示例
user_info = get_user_profile()
recent_tracks = get_recently_played()
top_tracks = get_top_tracks()

3.3 播放列表管理

def create_playlist(name, description="", public=True):
    """创建新的播放列表"""
    user_id = sp.current_user()['id']
    playlist = sp.user_playlist_create(
        user=user_id,
        name=name,
        public=public,
        description=description
    )
    print(f"播放列表 '{name}' 创建成功!")
    return playlist

def add_tracks_to_playlist(playlist_id, track_uris):
    """向播放列表添加歌曲"""
    sp.playlist_add_items(playlist_id, track_uris)
    print(f"成功添加 {len(track_uris)} 首歌曲到播放列表")

def get_playlist_tracks(playlist_id):
    """获取播放列表中的所有歌曲"""
    results = sp.playlist_items(playlist_id)
    tracks = []
    
    while results:
        tracks.extend(results['items'])
        if results['next']:
            results = sp.next(results)
        else:
            results = None
    
    print(f"播放列表包含 {len(tracks)} 首歌曲:")
    for idx, item in enumerate(tracks, 1):
        track = item['track']
        artists = ", ".join([artist['name'] for artist in track['artists']])
        print(f"{idx}. {track['name']} - {artists}")
    
    return tracks

# 示例：创建周杰伦精选集
def create_jay_chou_best():
    # 搜索周杰伦的热门歌曲
    results = sp.search(q='artist:周杰伦', limit=20, type='track')
    track_uris = [track['uri'] for track in results['tracks']['items']]
    
    # 创建播放列表
    playlist = create_playlist(
        "周杰伦精选", 
        "周杰伦经典歌曲合集", 
        public=True
    )
    
    # 添加歌曲
    add_tracks_to_playlist(playlist['id'], track_uris)
    return playlist

3.4 音乐推荐系统

def get_recommendations(seed_tracks=None, seed_artists=None, seed_genres=None, limit=20):
    """获取个性化音乐推荐"""
    recommendations = sp.recommendations(
        seed_tracks=seed_tracks,
        seed_artists=seed_artists,
        seed_genres=seed_genres,
        limit=limit
    )
    
    tracks = recommendations['tracks']
    print("为你推荐的歌曲:")
    for idx, track in enumerate(tracks, 1):
        artists = ", ".join([artist['name'] for artist in track['artists']])
        print(f"{idx}. {track['name']} - {artists}")
    
    return tracks

def get_audio_features(track_ids):
    """获取歌曲的音频特征"""
    features = sp.audio_features(track_ids)
    
    # 分析音频特征
    for i, feature in enumerate(features):
        if feature:
            print(f"\n歌曲 {i+1} 音频特征:")
            print(f"  舞蹈性: {feature['danceability']:.2f}")
            print(f"  能量: {feature['energy']:.2f}")
            print(f"  响度: {feature['loudness']:.2f} dB")
            print(f"  语速: {feature['speechiness']:.2f}")
            print(f"  乐器感: {feature['instrumentalness']:.2f}")
            print(f"  情绪: {feature['valence']:.2f}")
            print(f"  节奏: {feature['tempo']:.2f} BPM")
    
    return features

# 示例：基于最近播放生成推荐
def generate_recommendations_from_history():
    recent_tracks = get_recently_played(limit=5)
    seed_tracks = [track['track']['id'] for track in recent_tracks[:3]]
    
    recommendations = get_recommendations(seed_tracks=seed_tracks)
    return recommendations

4. 高级功能与应用场景

4.1 音乐数据分析

import pandas as pd
import matplotlib.pyplot as plt
from datetime import datetime

def analyze_listening_habits():
    """分析用户听歌习惯"""
    # 获取最近播放的100首歌曲
    results = sp.current_user_recently_played(limit=50)
    tracks_data = []
    
    for item in results['items']:
        track = item['track']
        played_at = datetime.fromisoformat(item['played_at'].replace('Z', '+00:00'))
        
        # 获取音频特征
        features = sp.audio_features([track['id']])[0]
        
        tracks_data.append({
            'name': track['name'],
            'artists': ', '.join([a['name'] for a in track['artists']]),
            'played_at': played_at,
            'danceability': features['danceability'] if features else None,
            'energy': features['energy'] if features else None,
            'valence': features['valence'] if features else None,
            'tempo': features['tempo'] if features else None
        })
    
    df = pd.DataFrame(tracks_data)
    
    # 分析听歌时间分布
    df['hour'] = df['played_at'].dt.hour
    hourly_distribution = df['hour'].value_counts().sort_index()
    
    # 绘制听歌时间分布图
    plt.figure(figsize=(12, 6))
    plt.subplot(1, 2, 1)
    hourly_distribution.plot(kind='bar')
    plt.title('听歌时间分布')
    plt.xlabel('小时')
    plt.ylabel('播放次数')
    
    # 绘制情绪分布图
    plt.subplot(1, 2, 2)
    df['valence'].plot(kind='hist', bins=10)
    plt.title('歌曲情绪分布')
    plt.xlabel('情绪值')
    plt.ylabel('歌曲数量')
    
    plt.tight_layout()
    plt.show()
    
    return df

def create_mood_playlist(mood='happy', limit=20):
    """根据情绪创建播放列表"""
    mood_params = {
        'happy': {'target_valence': 0.8, 'min_energy': 0.6},
        'sad': {'target_valence': 0.2, 'max_energy': 0.4},
        'energetic': {'target_energy': 0.8, 'min_tempo': 120},
        'calm': {'max_energy': 0.4, 'max_tempo': 100}
    }
    
    if mood not in mood_params:
        print("不支持的情绪类型")
        return None
    
    recommendations = sp.recommendations(
        limit=limit,
        **mood_params[mood]
    )
    
    playlist_name = f"{mood.capitalize()} Mood Playlist"
    playlist = create_playlist(playlist_name, f"自动生成的{mood}情绪播放列表")
    
    track_uris = [track['uri'] for track in recommendations['tracks']]
    add_tracks_to_playlist(playlist['id'], track_uris)
    
    print(f"已创建 '{playlist_name}'，包含 {len(track_uris)} 首歌曲")
    return playlist

4.2 批量操作与性能优化

import time
from concurrent.futures import ThreadPoolExecutor

def batch_get_tracks(track_ids, batch_size=50):
    """批量获取歌曲信息（性能优化）"""
    all_tracks = []
    
    for i in range(0, len(track_ids), batch_size):
        batch = track_ids[i:i+batch_size]
        tracks = sp.tracks(batch)['tracks']
        all_tracks.extend(tracks)
        time.sleep(0.1)  # 避免速率限制
    
    return all_tracks

def parallel_audio_features(track_ids, max_workers=4):
    """并行获取音频特征"""
    def get_features(track_id):
        try:
            return sp.audio_features([track_id])[0]
        except Exception as e:
            print(f"获取 {track_id} 特征失败: {e}")
            return None
    
    with ThreadPoolExecutor(max_workers=max_workers) as executor:
        features = list(executor.map(get_features, track_ids))
    
    return features

def export_playlist_to_csv(playlist_id, filename):
    """导出播放列表到CSV文件"""
    tracks = get_playlist_tracks(playlist_id)
    
    data = []
    for item in tracks:
        track = item['track']
        features = sp.audio_features([track['id']])[0]
        
        data.append({
            'name': track['name'],
            'artists': ', '.join([a['name'] for a in track['artists']]),
            'album': track['album']['name'],
            'duration_ms': track['duration_ms'],
            'popularity': track['popularity'],
            'danceability': features['danceability'] if features else None,
            'energy': features['energy'] if features else None,
            'valence': features['valence'] if features else None,
            'tempo': features['tempo'] if features else None
        })
    
    df = pd.DataFrame(data)
    df.to_csv(filename, index=False, encoding='utf-8-sig')
    print(f"播放列表已导出到 {filename}")
    return df

5. 错误处理与最佳实践

5.1 健壮的错误处理

from spotipy.exceptions import SpotifyException
import time

def safe_api_call(func, *args, **kwargs):
    """安全的API调用，包含重试机制"""
    max_retries = 3
    retry_delay = 1
    
    for attempt in range(max_retries):
        try:
            return func(*args, **kwargs)
        except SpotifyException as e:
            if e.http_status == 429:  # 速率限制
                retry_after = int(e.headers.get('Retry-After', retry_delay))
                print(f"速率限制，等待 {retry_after} 秒后重试...")
                time.sleep(retry_after)
                retry_delay *= 2  # 指数退避
            elif e.http_status >= 500:  # 服务器错误
                print(f"服务器错误，尝试 {attempt + 1}/{max_retries}")
                time.sleep(retry_delay)
            else:
                raise e
        except Exception as e:
            print(f"未知错误: {e}")
            if attempt == max_retries - 1:
                raise e
            time.sleep(retry_delay)
    
    raise Exception("API调用失败，超过最大重试次数")

# 使用安全调用的示例
def safe_search(query, **kwargs):
    return safe_api_call(sp.search, q=query, **kwargs)

def safe_get_playlist(playlist_id):
    return safe_api_call(sp.playlist, playlist_id)

5.2 缓存策略优化

from spotipy.cache_handler import CacheFileHandler
import json
import os

class SmartCacheHandler:
    """智能缓存处理器"""
    
    def __init__(self, cache_path=".spotipy_cache"):
        self.cache_path = cache_path
        os.makedirs(cache_path, exist_ok=True)
    
    def get_cached_token(self):
        try:
            with open(f"{self.cache_path}/token.json", 'r') as f:
                return json.load(f)
        except (FileNotFoundError, json.JSONDecodeError):
            return None
    
    def save_token_to_cache(self, token_info):
        with open(f"{self.cache_path}/token.json", 'w') as f:
            json.dump(token_info, f)
    
    def get_cached_data(self, key, expiry_hours=24):
        """获取缓存数据"""
        cache_file = f"{self.cache_path}/{key}.json"
        try:
            if os.path.exists(cache_file):
                file_age = time.time() - os.path.getmtime(cache_file)
                if file_age < expiry_hours * 3600:
                    with open(cache_file, 'r') as f:
                        return json.load(f)
        except:
            pass
        return None
    
    def save_data_to_cache(self, key, data):
        """保存数据到缓存"""
        cache_file = f"{self.cache_path}/{key}.json"
        with open(cache_file, 'w') as f:
            json.dump(data, f)

# 使用智能缓存的示例
cache_handler = SmartCacheHandler()

sp = spotipy.Spotify(auth_manager=SpotifyOAuth(
    cache_handler=cache_handler,
    scope="user-library-read"
))

def get_cached_top_tracks():
    """获取缓存的用户最爱歌曲"""
    cached = cache_handler.get_cached_data('top_tracks')
    if cached:
        print("使用缓存数据")
        return cached
    
    print("从API获取新数据")
    tracks = sp.current_user_top_tracks(limit=20)
    cache_handler.save_data_to_cache('top_tracks', tracks)
    return tracks

6. 实际应用案例

6.1 个人音乐年度报告

def generate_music_year_in_review():
    """生成个人音乐年度报告"""
    # 获取各种数据
    top_tracks = sp.current_user_top_tracks(limit=10, time_range='long_term')
    top_artists = sp.current_user_top_artists(limit=5, time_range='long_term')
    recently_played = sp.current_user_recently_played(limit=30)
    
    # 分析数据
    total_listening_minutes = sum(
        track['track']['duration_ms'] for item in recently_played['items'] 
        for track in [item['track']]
    ) / 60000  # 转换为分钟
    
    # 生成报告
    report = f"""
    🎵 你的音乐年度报告 🎵
    ======================
    
    年度数据统计:
    - 总收听时长: {total_listening_minutes:.1f} 分钟
    - 最常收听歌曲: {len(top_tracks['items'])} 首
    - 最喜爱艺术家: {len(top_artists['items'])} 位
    
    年度最爱歌曲:
    """
    
    for idx, track in enumerate(top_tracks['items'], 1):
        artists = ", ".join([artist['name'] for artist in track['artists']])
        report += f"{idx}. {track['name']} - {artists}\n"
    
    report += "\n年度最爱艺术家:\n"
    for idx, artist in enumerate(top_artists['items'], 1):
        report += f"{idx}. {artist['name']} - {artist['followers']['total']:,} 粉丝\n"
    
    print(report)
    return report

6.2 音乐发现机器人

def music_discovery_bot():
    """音乐发现机器人"""
    print("🎵 欢迎使用音乐发现机器人! 🎵")
    print("我会根据你的听歌习惯推荐新音乐")
    
    # 获取用户偏好
    top_artists = sp.current_user_top_artists(limit=3)
    seed_artists = [artist['id'] for artist in top_artists['items']]
    
    # 获取推荐
    recommendations = sp.recommendations(
        seed_artists=seed_artists,
        limit=10
    )
    
    print("\n根据你的听歌习惯，为你推荐以下歌曲:")
    for idx, track in enumerate(recommendations['tracks'], 1):
        artists = ", ".join([artist['name'] for artist in track['artists']])
        print(f"{idx}. {track['name']} - {artists}")
        print(f"   专辑: {track['album']['name']}")
        print(f"   流行度: {track['popularity']}/100")
        print()
    
    return recommendations['tracks']