漢語(yǔ)中介語(yǔ)語(yǔ)料庫
漢語(yǔ)中介語(yǔ)語(yǔ)料庫由北京語(yǔ)言大學(xué)于1992年開(kāi)始建設。該語(yǔ)料庫立足于漢語(yǔ)教學(xué)已收錄1635位外國學(xué)生共5774篇成篇成段的漢語(yǔ)作文或練習材料,總字數約353萬(wàn),其中1731 篇約104萬(wàn)字的語(yǔ)料經(jīng)過(guò)斷句、分詞和詞性標注等加工處理。目前該漢語(yǔ)中介語(yǔ)料庫仍處于努力建設過(guò)程中,北京語(yǔ)言大學(xué)仍然努力于建設全球漢語(yǔ)中介語(yǔ)語(yǔ)料庫,其規模預計達5000萬(wàn)字,包括筆語(yǔ)語(yǔ)料、口語(yǔ)語(yǔ)料和多模態(tài)子庫。筆語(yǔ)語(yǔ)料規模預計達4500萬(wàn)字,其中2000萬(wàn)字將加工成為熟語(yǔ)料;口語(yǔ)語(yǔ)料450小時(shí),約合400萬(wàn)字;多模態(tài)語(yǔ)料110小時(shí),約合100萬(wàn)字。