docs(predictV3): 添加predictV3算法优化研究文档和前端功能实现
- 完成Phase 11: predictV3算法优化研究文档,涵盖6个优化方向的技术分析 - 实现置信度评估功能,提供历史命中率、得分分布、多维度一致性置信度指标 - 扩展回测指标体系,新增NDCG@K、MRR、命中率分布等排名质量评估指标 - 优化转移概率算法,引入二阶马尔可夫链和多属性联合转移增强预测准确性 - 设计权重训练机制,支持网格搜索和遗传算法进行数据驱动的参数优化 - 集成组合特征挖掘功能,采用关联规则和序列模式发现号码间潜在关联 - 实现完整的前端交互界面,支持预测结果显示、置信度展示和回测验证功能 - 建立性能优化策略,包括预计算缓存、批量计算和降级策略保障响应速度
This commit is contained in:
@@ -844,25 +844,29 @@ foreach ($weights as $key => $value) {
|
||||
|
||||
---
|
||||
|
||||
## Open Questions
|
||||
## Open Questions (RESOLVED)
|
||||
|
||||
1. **历史数据量是否足够支撑高级优化?**
|
||||
- 当前默认200期统计,二阶马尔可夫和关联规则挖掘建议500期+
|
||||
- 需检查数据库中实际可用的历史期数
|
||||
- 推荐: 查询 `SELECT COUNT(*) FROM fa_history` 确认数据量
|
||||
- **Resolution:** 11-05 Task 3 设置100期阈值,数据不足时回退一阶马尔可夫,已在plan中处理
|
||||
|
||||
2. **权重优化结果如何持久化?**
|
||||
- 选项A: 存储到 `application/extra/predict.php` 配置文件
|
||||
- 选项B: 存储到数据库配置表
|
||||
- 选项C: 每次预测时动态计算(性能成本高)
|
||||
- **Resolution:** 11-04 采用选项C(动态计算)+ 返回结果给前端展示,不持久化。设计决策:避免过拟合特定时间段,每次获取最新优化结果
|
||||
|
||||
3. **置信度阈值如何定义?**
|
||||
- 当前假设: >=70%为高,50-70%为中,<50%为低
|
||||
- 需根据实际回测数据调整阈值
|
||||
- **Resolution:** 11-02 Task 1 明确阈值定义:>=70%高(绿色)、50-70%中(橙色)、<50%低(红色),前端11-03使用相同映射
|
||||
|
||||
4. **前端如何展示新增的回测指标(NDCG、MRR)?**
|
||||
- 需设计用户友好的展示方式
|
||||
- 可考虑简化为"预测质量评分"单一指标
|
||||
- **Resolution:** 11-03 Task 2 实现百分比显示 + 柱状图:NDCG@5/MRR以百分比展示,命中分布以柱状图可视化
|
||||
|
||||
---
|
||||
|
||||
|
||||
Reference in New Issue
Block a user