LTKalbos išteklių kaupimas, išsaugojimas skaitmeninėje terpėje, archyvavimas bei viešoji sklaida tapo kalbos mokslo kasdienybe. Tai pasakytina ne tik apie daugelį kalbų, nes didelė migracija stipriai pažeidžia regionines kalbos atmainas, dažniausiai neturinčias rašto tradicijų. Straipsnyje aptariama, kaip į skaitmeninį erdvę kelią skinasi lietuvių kalbos tarmės, kaip panašūs procesai vyksta ir kokios duomenų bazės kuriamos Švedijoje ir Estijoje. Šių šalių patirtis rodo, kad duomenų kaupimas yra gyvybiškai būtinas, bet tikrai ne paskutinis žingsnis - labai svarbu, kad duomenų sankaupa taptų patogiu ir funkcionaliu įrankiu tyrimams. Projekto "SweDia 2000" metu sukauptų duomenų pagrindu kuriama anotuota duomenų bazė, leidžianti garso įrašuose rasti reikiamus duomenis. Estijoje kuriamas anotuotas tarmių korpusas. Lietuvoje sistemingai renkama medžiaga iš viso lietuvių kalbos ploto. Siekiama patikrinti šiuo metu naudojamą tarmių klasifikaciją, patikslinti patarmių ribas ir pan. Kad surinkta medžiaga būtų naudinga kuo platesniam tyrėjų ratui, ją reikia sutvarkyti taip, kad būtų įmanoma rasti duomenis pagal pačius įvairiausius paieškos kriterijus. Taigi tarminių duomenų bazių ir anotuotų korpusų kūrimo patirtys itin aktualios.
ENCompiling language resources, storing them on digital media, making their archives and disseminating them in the public domain has become scientific routine. That is not something that is relevant just for a lot of languages, as the large scale of migration grievously damages regional strains of languages that usually do not have a written tradition. The article deals with Lithuanian dialects making their way to the digital space and with similar processes that are taking place in Sweden in Estonia, as well as the databases that are being established there. The experience of these countries shows that gathering data is a vital, yet not final step - it is important that data compilations become a handy and functional tool for researchers. The project "SweDia 2000" involves the development of a treebank that allows searching for the required data across audio records, Estonia is designing a treebank of dialects. Lithuania is systematically gathering material across the entire area of the Lithuanian language, aiming at verifying the existing classification of dialects, updating the boundaries of dialects, and so on. To make the material gathered useful to as many researchers as possible, it has to be arranged so that data can be found against a variety of search criteria, which makes the experiences of developing dialectal databases and treebanks extremely relevant.