一套为Rime输入法打造的全场景拼音解决方案,涵盖输入方案、带声调词库、预测模型、语法模型构建全流程。基于AI优化词库与32GB语料训练,实现智能整句输入与精准多音字处理。
1. RIME-LMDG - 语法模型
技术亮点:
- 🧠 32GB多领域语料训练(新闻/法律/文学/社交等)
- 📊 多级n-gram模型(支持2-4阶语境预测)
- 🔠 全汉字覆盖(CJK基本区→扩展G区)
- 🎯 精准多音字处理(词+拼音双键统计)
- 🛠️ 包含:
- 模型构建教程
- 每日更新的词库
- 语法模型LTS版本
- 预测模型预览版
- 分词优化脚本
- 语料清洗工具链
适用场景:适用于任何编码形式的rime方案,但由于是基于拼音优化,故模型命中利用率应该是:带声调方案>传统拼音(含双拼、全拼)>形码整句>词组类方案(基本等同于词库扩展)
2. rime_wanxiang - 基础版输入方案(全拼用户最佳选择)
差异化特性:
- ✨ 词库编码为声调全拼,可以通过这个基础库支持任何全拼或者双拼输入
- ✨ 只支持单字状态下`引导反查定位候选字
- ✨ 支持`引导的笔画或者部件组词反查
- ✨ 支持输入编码或者注释里面的带声调编码显示
- ✨ 支持新型造词用法,避免直接记忆用户词库污染
- ✨ 智能语言模型支持整句预测
- ✨ 支持同文输入法多键位布局(9/14/18键),属于试验性支持。
- 更多详见仓库说明
适合人群:传统输入法大厂输入法首次切换,全拼双拼用户,持有多平台终端的用户,如果万象成为你探索的起点那就从基础版开始吧,
1. rime_wanxiang_pro - 增强版输入方案
核心功能:
- ✨ 支持全拼+8种主流双拼(自然码/小鹤双拼/微软双拼/搜狗双拼/紫光双拼/智能ABC双拼/国标双拼/自然龙双拼(声调布局)等,用户也可以通过拼写运算获得任意双拼)
- ✨ 提供8种辅助码体系(自然码/小鹤/墨奇/汉心/简单鹤/五笔前2/仓颉/虎码首末)
- ✨ 词库编码为声调全拼+辅助码,可以通过这个库支持任何全拼或者双拼+8种辅助码任意组合搭配
- ✨ 智能语言模型支持整句预测
- ✨ 其他配套同基础版本
适合人群:具有双拼基础的用户,想要进阶辅助码辅助筛选的用户,持有多平台终端的用户
该项目整体三个仓库是为了提升现有rime开源应用中输入体验而做出的努力,并非创造了一种输入布局,开发了一个软件,仅仅是rime生态中基础底座这一环,所以使用者应当清晰认识到,这里找不到教会你使用双拼、使用辅助码的教程,这些应当在你兴趣的作用下自己去调研、去学习, 其次对于rime的用法配置全网也有很多教程和示例,可能需要一定基础才能做到“识货”,本项目也不会在这个上面花过多时间,项目仓库里面写了使用方法。我将会将精力持续放在优化模型、优化词库。