熊猫不是猫 困难与折磨对于人来说,是一把打向坯料的锤,打掉的应是脆弱的铁屑,锻成的将是锋利的钢刀。——契诃夫
博主

11小时前在线

熊猫不是猫
丈夫志四海,万里犹比邻。——曹植
歌曲封面 未知作品

萌ICP备20229950号 蜀ICP备2021028903号

网站已运行 5 年 199 天 7 小时 23 分

Powered by Typecho & Sunny

53 online · 93 ms

Title

绝了!极空间搭配视频智语,生产力拉满,多平台视频摘要一键搞定

panda

·

NAS教程

·

Article
⚠️ 本文最后更新于2025年09月01日,已经过了94天没有更新,若内容或图片失效,请留言反馈

NAS、键盘、路由器······年轻就要多折腾,我是爱折腾的熊猫,今天又给大家分享最近折腾的内容了,关注是对我最大的支持,阿里嘎多

引言

不得不说,极空间的用户可真是多才多艺。本期要介绍的项目,是用户用 AI 开发出来的。虽说靠 AI 开发,但这项目完成度相当高,不仅有 Web 界面,还支持 Docker 一键部署。
项目地址

项目为视频内容解析应用,像 YouTube、bilibili 这些主流平台它都支持。应用能自动下载视频并提取语音信息,还能把它们转录出来,接着用 AI 一键分析内容,从中提取重要部分,生成摘要。对于好多爱在网上看教程视频或者学习内容的用户来说,这功能可太实用了。要知道,很多教程视频时长特别长,要是看完自己去提炼里面的精华内容,那可太费时间了。但这个应用就能解决这个问题,帮用户轻松提炼精华。同时,它还能把视频内容转化成文字版本,方便储存,以后复习也方便。
项目页

项目地址为https://github.com/zhuguadundan/VideoWhisper,感兴趣的可以去多多支持。

部署机

转录得用到本地性能,所以熊猫在这儿用了性能相当不错的极空间 Z423 旗舰版。在做语音转录的时候,CPU 和内存的占用会比较高,尤其是内存。不过,Z423 旗舰版预装就有 32G 内存,就算运行时占用高,也不影响其他 Docker 和系统的流畅度。
部署机

除了内存,CPU 也会影响转录速度。虽说像 Z4 Pro 还有极空间早期的 Z4S 这些也能运行转录,但速度上,肯定还是用 AMD 5825U 的 Z423 旗舰版更快些。要是你对速度有要求,那就建议用处理器好点的 NAS 来部署。
性能介绍

部署过程

咱回到部署过程。项目都已经提供 compose 文件了,所以部署起来特简单。不过因为涉及数据持久化,所以部署之前,咱们得先把对应的映射文件夹建好。

项目的文件夹需要映射配置文件,接着是数据和日志这些。对应的文件夹分别是 /config、/output、/temp 还有 /logs 。在自己存 Docker 项目的文件夹里新建就行,建议用 M.2 固态硬盘。
准备工作

随后我们打开极空间的Docker应用,来到compose新建项目复制代码。

♾️ text 代码:
services:
  videowhisper:
    image: zhugua/videowhisper:latest  # 使用v0.15版本
    container_name: videowhisper-app
    ports:
      - "5000:5000"
    volumes:
      # 配置文件映射
      - ./config:/app/config
      # 数据目录映射 - 支持新的任务结构
      - ./output:/app/output
      - ./temp:/app/temp
      - ./logs:/app/logs
      # 可选:如果需要持久化任务历史
      # - ./data:/app/data
    environment:
      - TZ=Asia/Shanghai
      - FLASK_ENV=production
      - PYTHONPATH=/app
      # 设置文件权限相关环境变量
      - PYTHONUNBUFFERED=1
      - APP_VERSION=0.15.0
    restart: unless-stopped

    # 健康检查
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:5000/api/health"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 40s

    # 资源限制(可选)
    deploy:
      resources:
        limits:
          memory: 2G
          cpus: '4.0'
        reservations:
          memory: 1G
          cpus: '1'

这里面的文件夹映射,可以通过极空间查询路径的方法来映射。除此之外,咱们还得检查一下端口占用情况,要是发现有占用的,记得改一下。最后就是资源限制这方面,如果不想占用太多资源,自己设置个阈值就行。
新建项目

等所有检查都确定没啥问题了,点击创建就好啦。之后项目会自己去拉取镜像,最后按照咱们设置的环境变量新建容器。项目创建好后,在日志里应该就能看到对应的 Web 启动信息。
项目启动

项目使用

不管是通过极空间的远程访问,还是直接在浏览器里输入极空间 IP 加上冒号再加上端口号,都能访问项目的 Web 界面。项目没设置鉴权,所以千万别把它暴露到公网上用。
项目界面

在使用之前,咱们还得配置 API 信息。API 设置界面里,有语音识别服务、油管的 Cookies 配置、AI 文本处理服务,还有能进行 Obsidian 集成配置。按照提示填写就行,填完了记得测试一下,看看能不能正常连接,最后最后,一定要拉到最底部进行保存,熊猫首次使用就忘记了。
API设置

必填项填好以后,回到首页。这儿熊猫拿 B 站举例,把需要解析的 B 站视频链接复制下来,粘贴好,接着选择 AI 模型,再点击智能处理。这时候,项目就开始进行音频下载,之后会把音频分成几个片段来做语音转文字,最后对文字进行 AI 总结,还会优化格式再输出。
工作流程

速度跟 AI 模型、项目性能设置,还有视频长短都有关系。输出的内容还挺好的,能把原视频里的重点基本都概括到。在处理结果里,你可以选择查看逐字稿、总结报告,还有内容分析,而且还支持下载。
内容总结

最后在文件管理中能看到我们下载的音频文件以及对应报告的Markdown格式的文稿,支持下载以及删除。
文件管理

写在最后

项目挺好用的,不管是当成教程视频或者学习视频的总结工具,还是想给一些长视频做文字摘要,体验都不错。就算你没这方面需求,自己部署一个放着也没啥不行的,万一哪天有需要了,能马上拿出来用,毕竟技多不压身嘛。

以上便是本次分享的全部内容了,如果你觉得还算有趣或者对你有所帮助,不妨点赞收藏,最后也希望能得到你的关注,咱们下期见!
尾图

现在已有 491 次阅读,0 条评论,0 人点赞
Comment:共0条
发表
搜 索 消 息 足 迹
你还不曾留言过..
你还不曾留下足迹..
博主 欢迎来到熊猫的小站,站点内容已全部恢复,不过之前的评论无法恢复,如有友链请在友链界面自行申请 不再显示
博主