Python批量处理微信公众号图片资源

阿影博客/ 2024年7月13日 11:14 / 8767 阅读

热爱生活，热爱互联网！阿影博客

最近发现一些公众号的图片资源还是可以利用一下的。本着能让机器干的活绝不能自己动手的原则，于是决定使用Python批量处理，让机器来处理一下。

实现思路

首先需要找到微信公众号的图片外链的共同特点，例如域名格式等。然后通过匹配这些特点的外链，识别出需要的图片资源。接着，遍历匹配到的外链，进行批量下载。

实现代码

import os
import re
import requests
from urllib.parse import urlparse, parse_qs

# 定义读取文件、匹配网址并保存文件的函数
def extract_and_save_urls(file_name, output_folder='下载图片素材'):
    # 创建输出文件夹（如果不存在）
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # 读取文件内容
    with open(file_name, 'r', encoding='utf-8') as file:
        content = file.read()

    # 匹配网址的正则表达式
    url_pattern = re.compile(r'https://mmbiz\.qpic\.cn/mmbiz_png/[^\s]+')
    urls = url_pattern.findall(content)

    # 下载并保存文件
    for idx, url in enumerate(urls):
        try:
            response = requests.get(url)
            if response.status_code == 200:
                # 解析 URL 以获取文件扩展名
                parsed_url = urlparse(url)
                file_extension = parse_qs(parsed_url.query).get('wx_fmt', [''])[0]
                if not file_extension:  # 默认扩展名为 'png'，如果未指定 wx_fmt 参数
                    file_extension = 'png'
                file_name = f'image_{idx+1}.{file_extension}'
                file_name = file_name.replace('"', '').replace(',', '').replace('?', '') # 移除不必要的字符
                file_path = os.path.join(output_folder, file_name)
                with open(file_path, 'wb') as img_file:
                    img_file.write(response.content)
                print(f'Successfully saved {url} as {file_name}')
            else:
                print(f'Failed to download {url}, status code: {response.status_code}')
        except Exception as e:
            print(f'Error downloading {url}: {e}')

# 指定输入输出文件
file_name = 'data.js'  
extract_and_save_urls(file_name)

扩展

目前脚本只实现了对png格式图片的下载，可以扩展到其他格式如jpg、gif、jpeg等图片资源的匹配和下载。另外，目前脚本只能对指定的文件进行下载，可以增加支持读取整个目录下文件的功能。此外，微信公众号上不仅有图片资源，还有音频资源，可以进一步扩展脚本以支持下载公众号上的音频资源。
以上是关于使用Python批量处理微信公众号图片资源的实现思路。

Python批量处理微信公众号图片资源

实现思路

实现代码

扩展

更多推荐内容

相关推荐

微信零钱冻结的三种情况，分别应对方法全解析！

为什么说现在做抖音短视频很难？

搜索引擎排名SEO培训课程

为您的网站添加网站底部美化代码支持任意网站

发表评论

个人信息

随便看看

大家都在看

标签TAG

# Annie简约发卡系统 1.0开源版

# 【米禾阅读】1.5.3 免费小说阅读

# 最新临时文件快传系统源码轻量化带后台首发

# H5移动端在线影视视频短剧源码小剧场短剧影视源码

# 深入解析开源项目：如何高效阅读与理解软件源码结构

# python批量插入图片到word文档里并且实现分栏排版

# 国密SM4文件加解密工具

# 爱车签名8款PSD源码

# 150+套证件照换装素材PSD源码

# 方格音乐v1.7.3 免费无损 UI设计颜值极高

# 解除微信多开限制工具 BetterWX_Mutex 1.0.0

# 200+套网站轮播图PSD源码

您还未登阿影博客录

登录体验更多功能

实现思路

实现代码

扩展

更多推荐内容

相关推荐

微信零钱冻结的三种情况，分别应对方法全解析！

为什么说现在做抖音短视频很难？

搜索引擎排名SEO培训课程

为您的网站添加网站底部美化代码 支持任意网站

发表评论

个人信息

随便看看

大家都在看

标签TAG

# Annie简约发卡系统 1.0开源版

# 【米禾阅读】1.5.3 免费小说阅读

# 最新临时文件快传系统源码 轻量化 带后台 首发

# H5移动端在线影视视频短剧源码小剧场短剧影视源码

# 深入解析开源项目：如何高效阅读与理解软件源码结构

# python批量插入图片到word文档里并且实现分栏排版

# 国密SM4文件加解密工具

# 爱车签名8款PSD源码

# 150+套证件照换装素材PSD源码

# 方格音乐v1.7.3 免费无损 UI设计颜值极高

# 解除微信多开限制工具 BetterWX_Mutex 1.0.0

# 200+套网站轮播图PSD源码

为您的网站添加网站底部美化代码支持任意网站

# 最新临时文件快传系统源码轻量化带后台首发