背景音乐

天使动漫论坛 - 梦开始的地方

查看: 17746|回复: 3
打印 上一主题 下一主题

[心得] 【学习工具】啃轻小说/漫画时用到的工具分享

跳转到指定楼层
1#
raindrop213 发表于 2024-3-23 16:39:57 |只看该作者 |倒序浏览
本帖最后由 raindrop213 于 2026-1-30 23:40 编辑

分享一下我学习日文时候发现和使用的工具,会持续更新。

============  轻小说  ============

【1】(2024-03-23)
pc端浏览器上阅读方法。我也用过很多工具,每个人都有自己的习惯,所以这里只是提供思路。

目标:轻松提取日文,并且能翻译和查词。
思路:在现成的阅读软件很难自由地提取文字信息,而显示在浏览器中的文字却能很方便地进行提取甚至修改。
方法:通过浏览器插件来提取文字信息,有很多关于复制和翻译文字的插件,只需要找到适合自己的就行。

推荐工具:
书库 Calibre-web / ッツ
文字提取器
(Chrome插件)
AnonTranslator
翻译器 Lunatranslator
语音播报TTS 部署模型:vits-simple-api
推荐音源:vits-uma-genshin-honkai (含804个音源)


学日语真的要多听多读。实测通读两本小说之后就可相对自由地看漫画杂志,20本通过N1。现在总体来说日文原版epub资源还是挺好找的,只要不是太冷门。

插件效果:


插件+ Lunatranslator效果:



如何开始?

1. 在浏览器中看书

2. 文字提取器(AnonTranslator
本人写的插件,可 Chrome商城 下载。(复制朗读翻译网页中所选段落或者句子)

3. 翻译器(Lunatranslator
主打翻译Galgame,但其功能超级全面,还能拿去看漫画和小说。作者更新超级勤快,强烈推荐!!!
①使用剪切板模式;②然后按照教程安装Mecab;③词典建议moji/youdao/weblio;④翻译建议谷歌/有道(还支持ai翻译,如GPT、Claude、sakura等大语言模型)

4.TTS(vits)
Anon插件和LunaTranslator都可以调用vits,里面都提供了整合包链接

自用:ラノベ  まんが  文法


最后补充一下,任何机翻ai在日语上表现都不能说准确率足够高,但也完全够用对于初学者来说,我从一开始的完全不懂到渐渐能看出有翻译错误的地方就说明,即使前面的学习将错就错也不会导致你一直错下去,慢慢就能培养出语感并且理解句子意思了。
相较于很少一部分的错误,大量地积累日常用法才是初学者需要关注的,而这部分机翻完全能满足。



【2】(2025-04-19)
现在lunatranslator更新了api,所以写了个移动端上也能用的插件(油猴脚本)  LunaLens

实现方法:lunatranslator作为服务端处理分词、翻译、朗读和查词。使用本地的局域网ip连接或者使用云服务器。
教程直接看仓库吧:https://github.com/raindrop213/LunaLens
使用演示

============  漫画  ============

再更个啃漫画的方法吧。(2025.02.12)

目标:轻松识别漫画文字(竖版识别率高,能忽略振假名),并且能翻译和查词。
方法:通过浏览器插件来提取文字信息,有很多关于复制和翻译文字的插件,只需要找到适合自己的就行。
优势:在现成的阅读软件很难自定义操作,而mokuro除了本身阅读体验已经很好之外,其页面操作基本都写进了一个.js文件中,非常方便按照习惯自定义(不会的话发给 AI 啥都能改)。
※注:mokuro部分并非必要的,只不过是能一次性识别完整本漫画的工具而已,懒得弄的话也可以直接去我网站看。所以你单拿luna来直接看漫画也完全没问题,设置两个鼠标侧键,一个框一个读,学习体验还是很好的,啥资源都能看了。


推荐工具:
OCR & 阅读器 mokuro
还是luna翻译器 Lunatranslator
语音播报TTS(作为luna插件) vits-simple-api
OCR文字提取器(作为luna插件) manga-ocr


ocr体验流畅,识别效果比较准确

生成的html页面可以直接点击文字复制到剪切板。竖版识别率高,横版也都能识别,关键是能忽略振假名。但识别有时也会有错误的(如图最后的大字没识别出来),这时可以使用luna的ocr再手动识别一次,手动得到的准确率也会更高。

查词方便高效:

luna的翻译查词非常好用,支持非常多源,在线离线的都有。在线词典灵活性强(如图moji即使输入不完整或者有错也能识别出来,webilo能识别各种动词变形,俗语、典故都能有收录的),离线词典就专业性高,语法使用很完整。


如何开始?

1. 部署mokuro
  • 【如果你懂如何部署开源项目】自行布置吧 mokuro 文档写地很详细了。
  • 【如果你是小白】那就下载我打包好的 整合包(gpu比cpu版本快,如果电脑不支持gpu会自动切换回cpu,请选择合适版本)



2. 用mokuro进行ocr并生成html文件
在当前位置打开cmd窗口,复制命令,例如:


  1. mokuro-py310\python.exe -m mokuro --disable_confirmation --parent_dir "G:\pypj2\mokuro-portable-cpu\manga\[武田日向] やえかのカルテ" --as_one_file False


复制代码

这个示例是多卷命令,当前的文件结构如下:


  1. [武田日向] やえかのカルテ
  2.    │
  3.    ├─[武田日向] やえかのカルテ 第01巻
  4.    │      0000.jpg
  5.    │      ...
  6.    │      0016.jpg
  7.    │
  8.    ├─[武田日向] やえかのカルテ 第02巻
  9.    │      0000.jpg
  10.    │      ...
  11.    │      0006.jpg
  12.    │
  13.    └─[武田日向] やえかのカルテ 第03巻
  14.             0000.jpg
  15.             ...
  16.             0034.jpg


复制代码

引号里就填某部漫画的路径,路径下的全卷漫画都会陆续进行ocr并且生成文件【_ocr → xxx.mokuro → xxx.html】,接下来就可以用浏览器打开html看漫画了。具体细节看打包主页mokuro项目主页



3. 使用luna翻译器,打开剪切板模式...和上文啃小说部分一样,软件内有整合包链接
① 使用里面的manga-ocr功能(需要下载,放去哪里都行,运行start.bat,使用时不能关掉),这个ocr是最适合漫画的,别的都太不行。



② 使用里面的vits-simple-api功能(需要下载,放去哪里都行,运行start.bat,使用时不能关掉),当然tts可以选其他也行



4. 补充
mokuro-reader:mokuro+anki,把生成了的.mokuro文件和漫画压缩包拖进去就可以看了。
https://www.mokuro.moe/ 这网站本来是介绍mokuro的相关实践项目的,现在好像在维护中。而且他也分享了他用mokuro处理完的漫画,主页维护但文件都还在https://www.mokuro.moe/manga/


最后感觉看漫画学注意力真的很容易被画面表现带偏,作者分镜画的好的话可能不看字都行。个人觉得还是看小说的学习专注力高一点。



===========  有声书  ===========

经常听有声书的同学应该熟悉audibleaudiobook了吧,日本的有声书是没字幕的,所以要从这个媒介来学习有点太难了,所以就诞生了这些项目。(2025.02.16)

SubPlz:这个项目可以把电子书转成有声书的字幕,也就是做了语音文本对齐。
流程:
1. 输入处理。拆分章节化m4b音频和epub文本,提取电子书纯文本(去除格式/注释);
2. 语音转写。使用Whisper生成带时间戳的初步字幕,VAD辅助分割长静音段落;
3. 文本对齐。动态调整惩罚参数处理日语的助词省略现象;
4. 时间戳映射。将比对成功的文本段映射到音频时间戳,处理插入/删除导致的时序偏移。
技术:
Faster-Whisper:基于OpenAI Whisper优化的版本,快速生成带时间戳的字幕
Stable-ts:改进Whisper的时间戳准确性,处理模糊语音段落
Silero VAD:语音活动检测,精准定位语音段落
Needleman-Wunsch:文本对齐算法。用于源文本与转写文本的字符级对齐
subs2cia:语音提取与字幕合并工具
...
此外该项目还能用于视频字幕时间轴校对。


ttu-whispersync:这个项目是ッツ的插件,能通过SubPlz的srt字幕来桥接有声书和电子书,实现点击哪句读哪句的效果,并且还支持了anki,我认为这就是小说学习日语的最佳实践!!!效果演示
相关项目:audiobooksync2renpy    效果演示

我的演示:用SubPlz提取完srt字幕,并且按项目说明安装了ttu-whispersync之后在ッツ阅读器上这样做,最后还可以配合luna获得接近完美的阅读体验!



就先更到这儿吧,如果大家有什么有趣的日语学习项目欢迎来和交流。
已有 1 人评分威望 天使币 天然 腹黑 收起 理由
诺修斯 + 10 + 20 + 20 + 20 很给力!

总评分: 威望 + 10  天使币 + 20  天然 + 20  腹黑 + 20   查看全部评分

收到的礼物: x1 x1
2#
uwycuge 发表于 2024-9-4 14:57:36 |只看该作者
好帖,收藏了,谢谢楼主

使用道具 举报

3#
misscandy 发表于 2024-11-24 10:00:26 |只看该作者
Lunatranslator的原理是在线OCR+翻译吗?

使用道具 举报

4#
anyukari 发表于 2024-11-27 22:32:13 |只看该作者
感谢分享,这就用上了

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

Archiver|手机版|WAP| 天使动漫论坛

【免責聲明】【删除申请】所有內容資源來自網絡&網友分享,僅供日語學習試用,請于24小時內銷毀。如侵犯您的權益請告知,將會第壹時間刪除。我的邮箱

GMT+8, 2026-3-2 16:55 , Processed in 0.244408 second(s), 34 queries , Gzip On.

Powered by Discuz! X2

© 2010-2017 天使动漫论坛

回顶部