MMIE: 大规模多模态交错理解基准数据集概览
全称: Massive Multimodal Interleaved Comprehension Benchmark
规模: 20,103个多模态问题
许可证: MIT
发布时间: 2024年10月
下载量: 30/月
点赞数: 12
核心特性MMIE是专门评估大型视觉-语言模型(LVLMs)在”交错理解和生成”能力方面的基准测试数据集。
覆盖范围
12个主要领域: 数学、物理、编程、统计、文学、哲学、教育、金融、健康、体育、艺术、电子工程
102个子领域: 细分的专业领域
3种任务类型:
情境分析 (Situational Analysis)
项目式学习 (Project-Based Learning)
多步推理 (Multi-Step Reasoning)
数据结构1234567891011{ &qu...