0xAA55 发表于 2014-7-19 06:15:11

【文件结构】MIDI文件的结构和完整的读取方法

原帖:http://www.0xaa55.com/thread-717-1-1.html
转载请注明出处。

MIDI文件是一种多媒体音乐文件。不同于别的音乐文件,MIDI文件只记录曲谱。播放的时候,软件会读取MIDI文件的内容,然后把曲谱发送给声卡,由声卡模拟发音。相对于留声机原理的音乐文件(MP3、OGG、AMR、WAV、FLAC、AAC等),这种记录曲谱的文件更小,更容易创作。缺点是因为声音是软件模拟发出的,音质不能得到保证,而且不同的声卡有不同的发音效果,因此MIDI文件的播放效果不能得到保证。不过为此,微软提供了软波表合成器,使用微软的软波表可以实现MIDI文件效果的统一。

著名的游戏《恶魔之星III》(俗称“雷电3”)的背景音乐就是用MIDI音乐播放的效果。微软DirectX的组件DirectMusic就能用于播放MIDI音乐。

MIDI文件大体上分两个部分:文件头和音轨。
文件头由14个字节组成。开头是文件标识“MThd”,之后是一个Big-Endian存储的DWORD,值通常为6。这个值的意义是“文件头的信息所占字节数”,也就是文件头接下来6个字节的字节数(就是6了嘛)。之后的6个字节,其实是3个Big-Endian存储的WORD,分别是类型字,音轨数,每四分音符的Tick数。类型字有三个值:0表示这个文件只有一个音轨,1表示这个文件有多个音轨,播放的时候要同步播放所有音轨,2表示这个文件虽然有多个音轨,但是播放的时候必须一个音轨一个音轨的播放。
用一个结构体来描述MIDI文件头的结构:typedef struct
{
    DWORD   dwFlag;             //MThd标识
    DWORD   dwRestLen;          //剩余部分长度
    WORD    wType;            //类型
    WORD    wNbTracks;          //音轨数
    WORD    wTicksPerCrotchet;//每四分音符的Tick数
}MIDIHeader;以上就是文件头了。然后就是文件的重要部分:文件内容了。
文件内容由多个音轨组成,每个音轨的开头都是这样的结构:4字节的音轨标识"MTrk",4字节以Big-Endian存储的音轨字节数。如下所示:typedef struct
{
    DWORD   dwFlag;   //为0x6B72544D,即"MTrk"
    DWORD   dwTrackLen; //音轨长度(除去音轨头部以外的字节数)(Big-Endian)
}MIDITrack;其中dwTrackLen的值,是整个音轨的字节数减去音轨头部的8个字节。
每个音轨,除去音轨头部以外,剩下的就是主要的文件内容了。在介绍文件内容以前,我觉得有必要科普一下MIDI文件所用的“动态字节”是怎么回事。
首先这个动态字节存在的意义是为了减少一个数字的存储空间。1个字节是8位,我们拿出其中的低7位存储数字,那么我们能存储的范围是0-127,如果我们要存储的数字在这个范围内的话,我们就把最高位设置为0。而如果我们要存储的数字超出了0-127这个范围,那么我们就把最高位设置为1,然后记录下高7位,剩下的留给下一个字节。假设我们要存储111这个数字,因为它的值在0-127范围内,我们可以只用一个字节存储:01101111b。而假设我要存储333这个数字,把它转换成二进制的时候是101001101b,超出了7位能存储的范围,那么我们先提取出它的高7位和低7位:0000010和1001101.然后我们用这样的两个字节存储:10000010b和01001101b.当我们读取动态字节的时候,我们先读取一个字节,记录它的低7位,然后判断它的最高位来判断是否需要继续读取下一个字节。
以下VB代码用于展示读取动态字节的方法。调用的时候,以文件号1打开文件,然后用Seek #1定位文件指针,最后调用它来读取动态字节。'读取动态字节
Function ReadDynamicBytes(ValueOut As Long) As Long '返回读取的字节数
Dim OneByte As Byte
ValueOut = 0
For ReadDynamicBytes = 1 To 4 '最多读取4个字节
    Get #1, , OneByte '读取一个字节
    ValueOut = (ValueOut * &H80&) Or (OneByte And &H7F) '记录这个字节的低7位,同时左移以读取的数据让出位置。
    If (OneByte And &H80) = 0 Then Exit For '这个字节的最高位是0,没有后续字节,停止读取。
Next
End Function理论上动态字节可用于存储大数,不过特别大的数在MIDI文件里用不着。我们顶多读取4字节(28位整数)

讲完了动态字节,接下来就应该讲文件内容了。文件的内容都是“事件”,这些“事件”是一个接一个存储的。一个事件都有固定的结构:延迟,事件号,事件参数。
其中“延迟”是动态字节,用于表示上一个事件到这一个事件之间的延迟量。这个延迟量的单位是Tick。一个Tick有多长时间取决于MIDI文件的曲速。
事件号的值在0x80到0xFF之间的时候表示的是具体的值,若读取到的这个值在0到0x7F之间,则表示这个事件的事件号和上一个事件相同,而读取到的值是它的参数。
有关事件号的资料在网络上查找也大同小异。但是都讲得不够清楚。我专门写了一个C语言程序用于解释事件号。看源码便知。//=============================================================================
//作者:0xAA55
//论坛:http://www.0xaa55.com/
//版权所有(C) 2013-2014 技术宅的结界
//请保留原作者信息,否则视为侵权。
//-----------------------------------------------------------------------------
#include<stdio.h>
#include<malloc.h>

//统一类型长度
typedef signed int      MIDIInt,*MIDIIntP;
typedef signed char   MIDIInt8,*MIDIInt8P;
typedef signed short    MIDIInt16,*MIDIInt16P;
typedef signed long   MIDIInt32,*MIDIInt32P;
typedef unsigned int    MIDIUInt,*MIDIUIntP;
typedef unsigned char   MIDIUInt8,*MIDIUInt8P;
typedef unsigned shortMIDIUInt16,*MIDIUInt16P;
typedef unsigned long   MIDIUInt32,*MIDIUInt32P;

typedef MIDIUInt8       BYTE;
typedef MIDIUInt16      WORD;
typedef MIDIUInt32      DWORD;

//MIDI文件头的结构体
typedef struct
{
    DWORD   dwFlag;             //MThd标识
    DWORD   dwRestLen;          //剩余部分长度
    WORD    wType;            //类型
    WORD    wNbTracks;          //音轨数
    WORD    wTicksPerCrotchet;//每四分音符的Tick数
}MIDIHeader,*MIDIHeaderP;

//MIDI文件中出现过的标识
#define MIDI_MThd   0x6468544D
#define MIDI_MTrk   0x6B72544D

//MIDI文件头的“类型”
#define MIDIT_SingleTrack   0   /*单音轨*/
#define MIDIT_MultiSync   1   /*同步多音轨*/
#define MIDIT_MultiAsync    2   /*异步多音轨*/

//各种长度的Big-Endian到Little-Endian的转换
#define BSwapW(x)   ((((x) & 0xFF)<<8)|(((x) & 0xFF00)>>8))
#define BSwap24(x)((((x) & 0xFF)<<16)|((x) & 0xFF00)|(((x) & 0xFF0000)>>16))
#define BSwapD(x)   ((((x) & 0xFF)<<24)|(((x) & 0xFF00)<<8)|(((x) & 0xFF0000)>>8)|(((x) & 0xFF000000)>>24))

//将音符字节转换成字符串的函数
char*NoteToString(BYTE bNote);

//读取字符串然后打印
size_t ReadStringAndPrint(FILE*,size_t);

//=============================================================================
//ReadDynamicBytes:
//读取动态字节,最多读取4字节。返回读取的字节数
//-----------------------------------------------------------------------------
size_t ReadDynamicBytes(FILE*fp,DWORD*pOut)
{
    size_t bBytesRead;//已读取的字节数
    *pOut=0;
    for(bBytesRead=1;bBytesRead<=4;bBytesRead++)//最多读取4字节
    {
      int iValue=fgetc(fp);
      if(iValue==EOF)
            return 0;
      *pOut=(*pOut<<7)|(iValue & 0x7F);//新读入的是低位
      if(!(iValue & 0x80))//如果没有后续字节
            break;//就停止读取。
    }
    return bBytesRead;//返回读取的字节数
}

//=============================================================================
//ParseMIDI:
//分析MIDI文件。失败返回零,成功返回非零
//-----------------------------------------------------------------------------
int ParseMIDI(char*pszFileName)
{
#   define READERR {fprintf(stderr,"读取文件%s遇到错误\n",pszFileName);goto BadReturn;}
#   define FMTERR {fprintf(stderr,"%s不是一个正常的MIDI文件\n",pszFileName);goto BadReturn;}
#   define READ(x) if(fread(&(x),1,sizeof(x),fp)!=sizeof(x))READERR

    FILE*fp;
    MIDIHeader midiHeader;
    size_t i;

    //打开文件
    fp=fopen(pszFileName,"rb");
    if(!fp)
      READERR;

    //MIDI文件头就是一个MIDIHeader结构体。
    //但是要注意其中的数值都是Big-Endian存储的
    //需要进行转换

    //读取MIDI文件头
    READ(midiHeader);
   
    //检查文件格式
    if(midiHeader.dwFlag!=MIDI_MThd)//标识必须是"MThd"
      FMTERR;

    //转换为Little-Endian
    midiHeader.dwRestLen=         BSwapD(midiHeader.dwRestLen);
    midiHeader.wType=               BSwapW(midiHeader.wType);
    midiHeader.wNbTracks=         BSwapW(midiHeader.wNbTracks);
    midiHeader.wTicksPerCrotchet=   BSwapW(midiHeader.wTicksPerCrotchet);

    //分析文件头
    switch(midiHeader.wType)
    {
    case MIDIT_SingleTrack:
      fputs("类型:单音轨\n",stdout);
      break;
    case MIDIT_MultiSync:
      fputs("类型:同步多音轨\n",stdout);
      break;
    case MIDIT_MultiAsync:
      fputs("类型:异步多音轨\n",stdout);
      break;
    default:
      fprintf(stdout,"类型:未知(0x%04X)\n",midiHeader.wType);
      break;
    }

    //打印音轨数等信息
    fprintf(stdout,
      "音轨数:%u\n"
      "每四分音符时钟数:%u\n",
      midiHeader.wNbTracks,
      midiHeader.wTicksPerCrotchet);

    //正确跳转到MIDI音轨的位置,体现midiHeader.dwRestLen的作用……
    fseek(fp,8+midiHeader.dwRestLen,SEEK_SET);

    //准备读取各个音轨
    for(i=0;i<midiHeader.wNbTracks;i++)
    {
      DWORD dwTrackFlag;
      DWORD dwTrackLen;

      //每个音轨的开头都是一个dwTrackFlag和一个dwTrackLen
      //dwTrackFlag的值必须是MIDI_MTrk
      //dwTrackLen标记了下一个音轨的位置

      size_t TrackStartPos;

      fputs("读取音轨\n",stdout);

      READ(dwTrackFlag);if(dwTrackFlag!=MIDI_MTrk)FMTERR;//检查文件格式
      READ(dwTrackLen);   TrackStartPos=ftell(fp);//记录当前位置

      //转换Big-Endian
      dwTrackLen=BSwapD(dwTrackLen);

      //显示每个音轨的字节数
      fprintf(stdout,"音轨大小:%u 字节\n",dwTrackLen);

      //音轨的重要内容是事件数据
      for(;;)//循环读取事件
      {
            DWORD dwDelay;
            BYTE bEvent;

            //每个事件的构成都是:
            //延时,事件号,参数
            //其中的延时是动态字节,参数大小随事件号而定

            //上一个事件号
            BYTE bLastEvent;

            //读取延时
            if(!ReadDynamicBytes(fp,&dwDelay))
                READERR;

            //读取事件号
            READ(bEvent);

            //每读取一个事件,打印这个事件的时间
            fprintf(stdout,"时间:%u,",dwDelay);

            //分析事件
ProcEvent:if(bEvent <= 0x7F)
            {//0到0x7F:和上一个事件的事件号相同,而读取的这个字节就是上一个事件号的参数的第一个字节
                fseek(fp,-1,SEEK_CUR);//回退一个字节
                bEvent=bLastEvent;
                goto ProcEvent;
            }
            else if(bEvent <= 0x8F)
            {//0x80到0x8F:松开音符
                BYTE bNote,bVel;

                READ(bNote);//音符
                READ(bVel); //力度

                fprintf(stdout,"(通道%u)松开音符:%s, 力度:%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  NoteToString(bNote),//音高
                  bVel);//力度
            }
            else if(bEvent <= 0x9F)
            {//0x90到0x9F:按下音符
                BYTE bNote,bVel;

                READ(bNote);//音符
                READ(bVel); //力度

                fprintf(stdout,"(通道%u)按下音符:%s, 力度:%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  NoteToString(bNote),//音高
                  bVel);//力度
            }
            else if(bEvent <= 0xAF)
            {//0xA0到0xAF:触后音符
                BYTE bNote,bVel;

                READ(bNote);//音符
                READ(bVel); //力度

                fprintf(stdout,"(通道%u)触后音符:%s, 力度:%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  NoteToString(bNote),//音高
                  bVel);//力度
            }
            else if(bEvent <= 0xBF)
            {//0xB0到0xBF:控制器
                BYTE bReg,bVal;

                READ(bReg);//寄存器号
                READ(bVal);//寄存器值

                fprintf(stdout,"(通道%u)控制器:%u,值=%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  bReg,//寄存器
                  bVal);//值
            }
            else if(bEvent <= 0xCF)
            {//0xC0到0xCF:改变乐器
                BYTE bInstrument;

                READ(bInstrument);//乐器号
               
                fprintf(stdout,"(通道%u)改变乐器:%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  bInstrument);//乐器号
            }
            else if(bEvent <= 0xDF)
            {//0xD0到0xDF:触后通道
                BYTE bChannel;

                READ(bChannel);//通道号
               
                fprintf(stdout,"(通道%u)触后通道:%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  bChannel);//通道号
            }
            else if(bEvent <= 0xEF)
            {//0xE0到0xEF:滑音
                WORD wPitch;//滑音参数是Little-Endian的WORD

                READ(wPitch);
               
                fprintf(stdout,"(通道%u)滑音:%u\n",
                  bEvent & 0xF,//低4位表示通道数
                  wPitch);//滑音
            }
            else if(bEvent == 0xF0)
            {//0xF0:系统码
                BYTE bSysCode=0;

                fputs("系统码:",stdout);
                for(;;)
                {
                  READ(bSysCode);
                  if(bSysCode!=0xF7)
                        fprintf(stdout,"0x%02X,",bSysCode);
                  else
                  {
                        fprintf(stdout,"0x%02X\n",bSysCode);
                        break;//读取到0xF7结束
                  }
                }
            }
            else if(bEvent == 0xFF)
            {//元事件
                BYTE bType,bBytes;
                size_t CurrentPos;
               
                READ(bType);//元数据类型
                READ(bBytes);//元数据字节数

                CurrentPos=ftell(fp);//记录元数据读取的位置

                fputs("元数据 - ",stdout);

                switch(bType)
                {
                case 0x00://设置轨道音序
                  {
                        WORD wTrackSeq;
                        READ(wTrackSeq);
                        wTrackSeq=BSwapW(wTrackSeq);
                        fprintf(stdout,"设置轨道音序:0x%04X\n",wTrackSeq);
                  }
                  break;
                case 0x01://歌曲备注
                  fputs("备注:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x02://版权
                  fputs("版权:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x03://歌曲标题
                  fputs("标题:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x04://乐器名称
                  fputs("乐器名:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x05://歌词
                  fputs("歌词:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x06://标记
                  fputs("标记:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x07://开始点
                  fputs("开始点:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                case 0x21://音轨开始标识
                  fputs("音轨开始标识.\n",stdout);
                  break;
                case 0x2F://音轨结束标识
                  fputs("音轨结束标识.\n",stdout);
                  goto EndOfTrack;
                case 0x51://速度
                  {
                        BYTE bVelocity1,bVelocity2,bVelocity3;

                        //速度是24位整数,一个四分音符的微秒数。
                        READ(bVelocity1);
                        READ(bVelocity2);
                        READ(bVelocity3);

                        //而且是Big-Endian
                        fprintf(stdout,"速度: 每四分音符%u微秒.\n",
                            bVelocity3|(bVelocity2<<8)|(bVelocity1<<16));
                  }
                  break;
                case 0x58://节拍
                  {
                        BYTE bBeatNumerator,bBeatDenominator,bMetronomeTimer,bNb32ndNotesInCrotchet;

                        READ(bBeatNumerator);//分子
                        READ(bBeatDenominator);//分母
                        READ(bMetronomeTimer);//节拍器时钟
                        READ(bNb32ndNotesInCrotchet);//每四分音符有多少三十二分音符

                        fprintf(stdout,"节拍:%u/%u. 节拍器时钟:%u. 每四分音符有%u个三十二分音符.\n",
                            bBeatNumerator,bBeatDenominator,bMetronomeTimer,bNb32ndNotesInCrotchet);
                  }
                  break;
                case 0x59://调号
                  {
                        MIDIInt8 bTunePitch;
                        BYTE bTuneType;

                        READ(bTunePitch);//升降号
                        READ(bTuneType);//大调、小调

                        fprintf(stdout,"升降号:%d, ",bTunePitch);
                        switch(bTuneType)
                        {
                        case 0://大调
                            fputs("大调\n",stdout);
                            break;
                        case 1://小调
                            fputs("小调\n",stdout);
                            break;
                        default://不知道
                            fprintf(stdout,"未知调(0x%02X).\n",bTuneType);
                            break;
                        }
                  }
                  break;
                case 0x7F://音序特定信息
                  fputs("音序特定信息:",stdout);
                  ReadStringAndPrint(fp,bBytes);
                  fputc('\n',stdout);
                  break;
                default:
                  fprintf(stdout,"未知元数据类型(0x%02X)\n",bType);
                  break;
                }

                fseek(fp,CurrentPos+bBytes,SEEK_SET);//读取完成后正确跳到下一个事件的位置。
            }
            else//其它事件,未知事件
            {
                fprintf(stdout,"未知事件:0x%08X. 停止当前音轨的分析。\n",bEvent);
                break;
            }

            //记录上一个事件号
            bLastEvent=bEvent;
      }//回去继续读取事件。

EndOfTrack:
      fseek(fp,TrackStartPos+dwTrackLen,SEEK_SET);//转到下一个音轨
    }

    fputs("MIDI文件读取结束。\n",stdout);

    fclose(fp);
    return 1;
BadReturn:
    fclose(fp);
    return 0;

#   undef READ
#   undef READERR
}

//=============================================================================
//NoteToString:
//将音符音高转换为字符串
//其实每次返回的都是同一缓冲区,只是每次都改写了缓冲区的值。
//-----------------------------------------------------------------------------
char*NoteToString(BYTE bNote)
{
    static char szBuf;//顶多5字符
    switch(bNote % 12)
    {
    case 0:
      sprintf(szBuf,"C%d",(int)(bNote / 12)-2);
      break;
    case 1:
      sprintf(szBuf,"C%d#",(int)(bNote / 12)-2);
      break;
    case 2:
      sprintf(szBuf,"D%d",(int)(bNote / 12)-2);
      break;
    case 3:
      sprintf(szBuf,"D%d#",(int)(bNote / 12)-2);
      break;
    case 4:
      sprintf(szBuf,"E%d",(int)(bNote / 12)-2);
      break;
    case 5:
      sprintf(szBuf,"F%d",(int)(bNote / 12)-2);
      break;
    case 6:
      sprintf(szBuf,"F%d#",(int)(bNote / 12)-2);
      break;
    case 7:
      sprintf(szBuf,"G%d",(int)(bNote / 12)-2);
      break;
    case 8:
      sprintf(szBuf,"G%d#",(int)(bNote / 12)-2);
      break;
    case 9:
      sprintf(szBuf,"A%d",(int)(bNote / 12)-2);
      break;
    case 10:
      sprintf(szBuf,"A%d#",(int)(bNote / 12)-2);
      break;
    case 11:
      sprintf(szBuf,"B%d",(int)(bNote / 12)-2);
      break;
    }
    return szBuf;
}

//=============================================================================
//ReadStringAndPrint
//读取字符串然后打印。返回读取的字节数
//-----------------------------------------------------------------------------
size_t ReadStringAndPrint(FILE*fp,size_t szLength)
{
    char*pBuf;
    pBuf=(char*)malloc(szLength+1);
    if(pBuf)//分配内存一次读取
    {
      size_t Ret=fread(pBuf,1,szLength,fp);
      pBuf=0;//结尾的\0
      fputs(pBuf,stdout);
      free(pBuf);
      return Ret;
    }
    else
    {
      fputs("无法将字符串读入内存。\n",stderr);
      return 0;
    }
}

//=============================================================================
//main:
//入口
//-----------------------------------------------------------------------------
int main(int argc,char**argv)
{
    if(argc<2)
    {
      fprintf(stderr,
            "Usage:\n"
            "%s midifile.mid\n",argv?argv:"MIDIFile");
      return 1;
    }

    ParseMIDI(argv);
    return 0;
}BIN:
SRC:

曦。风起 发表于 2017-2-21 18:53:56

好东西,好好学习

tx7790 发表于 2017-2-22 10:51:36

这个资料在十几年前应该很有用。。。

0xAA55 发表于 2017-2-22 12:55:42

tx7790 发表于 2017-2-22 10:51
这个资料在十几年前应该很有用。。。

现在依然有用,尤其是嵌入式开发,这个技术根本就没过时

KAKA 发表于 2017-7-6 18:15:27

谢谢楼主分享!!

ABC 发表于 2017-8-21 00:24:55

学习了…感谢楼主!

白天 发表于 2017-10-25 01:52:21

谢谢楼主分享

白天 发表于 2017-10-25 02:27:32

正好在写这方面的程序

断念兰 发表于 2017-11-5 19:13:50

挺好的,这个文件挺有用的

(⊙o⊙) 发表于 2017-11-7 07:50:28

感谢源代码。收藏

yang 发表于 2017-12-1 15:46:38

在做音乐方面的,希望可以用到

yang 发表于 2017-12-4 10:42:41

mac上跑的有问题,:(

再见肥仔扑 发表于 2018-1-3 14:59:16


挺好的,这个文件挺有用的

jay 发表于 2018-2-25 22:19:45

谢谢楼主分享

qqss335 发表于 2018-4-28 23:12:04

跑这个程序应该出什么结果?文件名应该在什么地方修改?

8421 发表于 2019-9-9 21:53:46

你这个程序有问题,元事件长度用ReadDynamicBytes函数读取的

PrincessSnow 发表于 2021-3-11 03:21:46

谢谢大佬的教程 收藏起来观摩一波

aceansha 发表于 2022-11-7 15:01:25

搞嵌入式开发入门,对这个完全不懂

imr2013 发表于 2022-11-23 23:08:56

学习一下,给小孩编个小程序
页: [1]
查看完整版本: 【文件结构】MIDI文件的结构和完整的读取方法