Какое количество слов содержится в словаре в и даля
На составление знаменитого «Толкового словаря живого великорусского языка» лингвист-самоучка Владимир Даль потратил 53 года жизни, на протяжении которых он по крупицам собирал диалектные, жаргонные и профессиональные слова, отражавшие всю полноту и своеобразие родной речи.
Работая над этим многотомным трудом, он, несомненно, обогатил русское языкознание, но вместе с тем допустил достаточное количество ляпов в грамматике и лексике слов-определений.
Орфографические ляпы
Даль не испытывавший особую любовь к двойным согласным, настаивал что слово «русский» необходимо писать с одной буквой «с», то есть «руский».
Чтобы оправдать свою точку зрению, он отсылал читателей к древним литературным источникам, в которых часто встречались выражения «Правда Руская», «руская земля», «руский человек».
Действительно подобное написание имело место в допетровской России, но после его воцарения произошло изменение в орфографии данного слова.
Даль видел виновницей этой «противной» для русского языка и едва различимой русским ухом сдвоенного «С» Польшу, которая «прозвала нас Россiей, россiянами, россiйскими, по правописанию латинскому, а мы переняли это, перенесли в кирилицу свою и пишем русскiй!».
Позже лингвисты совместно с историками опровергли эту версию, поскольку слово «Россия» имеет греческие, а не польско-латинские корни, кроме того ими были найдены доказательства, что и в древнерусских анналах обнаруживается написание данной лексемы с двумя «СС» в суффиксе только в вариации «русЬский».
От скептического отношения Даля к сдвоенным согласным пострадали такие слова как, кириллица — «кирилица», рассрочить — «расрочить», восстать — «востать», соображать — «сображать», вооружать — «воружать», и другие, корректировку которых после смерти составителя провёл Иван Бодуэн де Куртенэ.
Он же внедрил в доработанное третье издание «Толкового словаря живого великорусского языка» букву «ё», которую всячески избегал Даль, писавший например, вместо слова берёза — «береза».
Выдуманные слова
Из 200 тысяч слов, включённых Далем в свой труд, по мнению исследователей, 14 тысяч являются выдуманными лексемами, одна часть которых была создана им для замены иностранных аналогов, а другая, для демонстрации широкого диапазона словообразовательного потенциала русского языка.
На эту особенность толкового словаря указали его первые рецензенты из Этнографического отделения Русского географического общества, на обвинения которых о вымышленном характере некоторых слов Даль откликнулся в статье «Ответ на приговор».
Не признавая упрёков учёных, рекомендовавших ему рядом с необычными словами указывать «где и как они были сообщены составителю» Даль утверждал, что в его работе нет ни одного выдуманного термина, вынесенного в объясняемое понятие, а все незнакомые лексемы присутствуют только в толкованиях.
Единственным термином в отношении, которого он признал своё языкотворчество, было «ловкосилие», придуманное им для обозначения гимнастики.
Ратовавший за сохранение чистоты русского языка Даль, в отличие от своих предшественников составивших «Словарь Академии Российской», включил в свой труд употребляемые в тот момент иностранные слова, подбирая в пояснительной статье к ним аналоги на родном наречье.
Таким образом, он пытался вытеснить заимствованные лексемы путём внедрения в обиход идентичных им по смыслу русских синонимов, многие из которых были простонародными, устаревшими или узкодиалектными словами.
Так с подачи Даля конкурс превратился в «спорованье», анатомия в «телословие», диафрагма в «вздошье», акустика в «звукословие», адрес в «насыл», диалектика в «умословие», канделябр в «свечник», горизонт в «овидь», кокетка в «хорошуху», эгоизм в «самотность», а гримаса в «рожекорчу».
Ошибочные гнёзда
Компонуя словарь, Даль использовал для подачи информации алфавитно-гнездовой принцип, который затруднял поиск конкретного слова, но должен был содействовать выявлению словообразования. Однако исследователи его многотомного труда указывали, что именно в этой области отчётливо прослеживалась недостаточно высокая компетенция автора в вопросах лингвистики.
Разделяя по разным гнёздам такие родственные слова как, «знак» и «значок», «круг» и «кружок», «дичь» и «дикий», он объединял в одну группу созвучные, но не сочетающиеся по смыслу термины, например «акт» и «акциз», «дышать» и «дышло», «абрек» и «обрекаться».
Впрочем, в 3-м издании «Толкового словаря» Иван Бодуэн де Куртенэ по возможности исправил эти огрехи, что, конечно же, привело к частичной перекройке первоначальной структуры подачи материала Даля, но сделало книгу более точной.
Странные толкования
К ляпам словаря Даля можно однозначно отнести весьма приблизительное, малоинформативное и не всегда логически верное толкование значений. Заведомо отказавшись от целостного повествовательного раскрытия смысла того или иного термина, Владимир Иванович, стремившийся избегать «сухие бесплодные определения», объяснял одни слова другими.
Выстраивая длинный ряд синонимов к трактуемому понятию, Даль передавал заложенный в слове смысл, порой сближая совершенно разные лексемы, как это произошло с термином «бобыль», который он раскрыл по средствам синонима пролетарий.
Иногда для расшифровки смысла слова Даль обращался к народному творчеству, и приводил в качестве определения пословицы и поговорки, которых в его труде представлено около 30 тысяч.
Толковый словарь Даля известен всему миру, так как он стал огромнейшим трудом русской филологии и лексикологии. Эта книга была создана Владимиром Ивановичем Далем практически полтора века назад, но актуальной она остаётся и до сих пор. Ценность «Толкового словаря живого великорусского языка» подчёркивается тем, что в нём можно найти значение не только десятков тысяч слов, но и в словарные статьи его помещено большое количество поговорок, загадок и пословиц.
Общее описание
Владимир Даль при составлении своего словаря смог показать всё величие, богатство и разнообразие русского языка. Словарик Даля даёт не только объяснение региональных особенностей речи, но также использует профессиональную терминологию.
Свой словарь Владимир Даль писал в течение 53 лет. Это происходило в девятнадцатом веке. Известно, что он содержит около 200 тысяч слов и 30 тысяч поговорок, присловий, пословиц и загадок, которые позволяют понять толкование слов, которые занесены в книгу. Книга Даля позволяет получить информацию не только о языке, но и о быте, поверьях и приметах тех мест, где зародились эти слова.
Как пример можно взять слово «лапоть». В «Словаре русского языка» Даля дается не только лексическое значение, но и характеризуются все виды лаптей, указываются даже способы их изготовления.
Если в справочнике Даля посмотреть словарные статьи слов «мачта» и «парус», то можно увидеть не только их объяснения, но и узнать все их виды и то, для чего предназначен каждый вид паруса или мачты. При этом автор использует как российские морские названия, так и заимствованные в голландском и английском языках.
Уже за первые издания своего словаря Владимир Иванович получил заслуженные награды: Константиновскую медаль и Ломоносовскую премию, а также вскоре он был избран и почётным членом научной Академии.
Структура словаря
Известно, что в своей уникальной книге автор поместил слова так, что в нём нет какого-то особого отбора. Сам словарь не подчиняется определённым нормам оформления таких изданий, так как в нём нет стилистических и грамматических характеристик. Несмотря на то, что Владимир Иванович Даль «Словарь живого великорусского языка» оснастил множествами примерами использования слов, но вот точных и развёрнутых определений он не даёт.
Сам словарь составлен автором по алфавитно-гнездовому принципу, который позволяет понять, как образуются слова, но это затрудняет поиски по книге. Но гнездовая структура словаря выполнена неаккуратно, поэтому порой можно встретить просторечья, которые созвучны, но при этом они не являются родственными. А бывает и наоборот, что родственные слова разделены на несколько словарных статей.
Так, Владимир Иванович в своём словаре соединил в одно гнездо:
- Акт.
- Актёр.
- Акциз.
- Акция.
Но вот в разные гнёзда попали такие однокоренные слова, как:
- Значок и знак.
- Дичь и дикий.
- Кружить и круг.
Учитывая всё это, редактор Бодуэн де Куртенэ, выпуская словарь уже в третий и четвёртый раз, немного перестроил структуру книги. В результате пользоваться книгой оказалось намного проще, но вот только авторская система уже была нарушена.
Если слова были заимствованные, то тогда составитель сам придумывал и записывал в словарь несколько просторечий:
- Вместо «гармония», которое заимствовано из латинского языка, он придумал «сглас».
- «Автомат», которое заимствовано из французского языка, Даль заменил на «живуля».
- «Гимнастика», которое заимствовано из греческого языка, составитель заменил на «ловкосилье».
Но как только был издан первый словарь, сразу же было замечено, что автор поместил в него свои слова. Пришлось собирателю написать и поместить статью «Ответ на приговор», где признаётся в том, что в его книге есть диалекты, которых раньше ещё не было в обиходе.
История создания
В начале марта 1819 года молодой мичман был отправлен в Николаев. Отправляясь в почтовой повозке в дорогу, молодой выпускник кадетского корпуса в Санкт-Петербурге не думал, что будет замерзать от холода. Особенно сильно холод пробирал ночью.
В это время ямщик, управляя лошадьми, бормотал какое-то незнакомое Далю слово, указывая на небо. Владимир Иванович достаёт записную книжку и небольшой карандаш и замершими пальцами с трудом выводит первую фразу о том, что «замолаживает» означает небо, которое закрыто тучами.
Так было положено начало коллекционированию, которому мичман Даль посвятил несколько десятилетий своей жизни. В течение практически всей своей жизни он записывал те диалекты, которые раньше никогда не слышал.
Начиная с 1826 года, в течение нескольких лет Даль обучался на медицинском факультете Дерптского университета. Затем Даль служил хирургом на русско-японской войне и в перерывах между операциями он постоянно записывал новые слова в свой блокнот. После этого он стал участником польской компании и также продолжал коллекционировать слова.
Когда в 1831 году он устроился на службу к губернатору Оренбургской губернии, то много разъезжал по стране, где слышал новые слова и обороты речи. Слова он записывал не только в кабаках, но и на светских приёмах.
Как вспоминает дочь великого собирателя слов, уже лёжа в постели, совершенно больной, он попросил её записать ещё четыре слова в его словарь, которые он услышал от прислуги. А уже через неделю Владимир Иванович умер. Собирание стало для Владимира Ивановича делом всей жизни.
Когда он стал собирать диалекты, то ставил основной целью оживить литературный язык, разбавляя его с простым языком крестьян, на котором говорит вся страна. Владимир Иванович был уверен в том, что на русском языке можно что угодно объяснить, сказать и выразить.
Известно, что один из бывших министров просвещения однажды, узнав о его коллекции, предложил Владимиру Далю продать академии собранные диалекты по следующей расценке:
- Одно слово, которого нет в словаре академии, — 15 копеек.
- Если к уже имеющемуся слову была добавка или поправка какая-либо — 7,5 копеек.
Но Даль был против такой сделки и предложил свои условия для передачи собранного материала: он готов отдать всё, если ему назначать содержание. Но академия не согласилась с таким предложением собирателя и опять выдвинула своё прежнее предложение. Даль всё-таки отправил тысячу слов с дополнением. Академия интересовалась и тем, сколько ещё осталось в запасе у Даля. Но точного их количества он и сам не знал. Больше подобных сделок с академией не было.
Издания справочника Даля
В 1863 году вышло первое издание словаря Даля, которое переиздаётся до сих пор. Содержание книги — это лексика письменной и устной речи девятнадцатого века, в которую входит в том числе и терминология, а также слова, связанные с ремесленными делами и с различными профессиями.
Известно, что только в России известный словарик Даля к 2004 году уже переиздавался более 40 раз, а, начиная с 2005 года, в течение девяти лет он переиздавался ещё около 100 раз, причём это были не только оригинальные копии, но и изменённые версии. В 1998 году словарик стал издаваться и в электронном виде, но только в нем была соблюдена современная орфография и нет никакого графического оформления. Но второе электронное издание уже всё-таки частично имеет оформление.
Осенью 2013 года в Луганске, где родился Владимир Даль, на 300 объектах города были размещены таблички со словарными статьями из книги. За это Луганск получил название «город—словарь».
Сто пятьдесят лет назад был впервые полностью опубликован словарь Даля
. Он прославился как словарь именно живого, повседневного языка, на котором говорили в России в середине XIX века. Мы решили посмотреть, насколько сильно с тех пор изменился язык, и сравнили слова из словаря Даля с теми, которые используют люди в поисковых запросах.
Словарь Даля не является нормативным — то есть его далеко не всегда можно использовать для ответа на вопросы «как пишется то или иное слово» или «что значит то или иное слово». Зато он представляет собой уникальный справочник по живому разговорному языку XIX века, который можно читать не как словарь, а просто подряд. Поисковые запросы содержат в том числе и разговорную лексику, так что сравнив слова из словаря со словами из запросов, можно увидеть, какие изменения произошли за 150 лет.
Количество слов в словаре Даля обычно оценивается приблизительно — около 200 тысяч. Это те слова, которые Даль называл «красными», для которых дано толкование. Эти слова организованы в гнёзда — немногим более 40 тысяч гнёзд и, соответственно, гнездовых слов. Читать дальше в блоге Яндекса
За год Яндекс отвечает примерно на 70 миллиардов запросов из России. Если по пробелам и специальным символам разделить эти запросы на словоформы, выбрать только те, которые состоят из кириллических букв, и автоматически привести их к начальной форме, получается больше 285 миллионов разных слов. На самом деле далеко не все из них настоящие русские слова: в поиске люди часто пишут с ошибками — [детский мир отзовы], [турагенство] — и в неправильной раскладке — [нщгегиу]
, а иногда просто вводят непонятные последовательности букв — [аааааааааааааау].
Чтобы сделать этот огромный список слов чище, мы сравнили его со словами из Национального корпуса русского языка за XX и XXI века. Пересечений оказалось всего около 750 тысяч. Можно сказать, что это слова, которые употребляются в современных текстах разных жанров — от художественной литературы до деловых документов
.
Даль даёт толкование примерно двухсот тысяч слов
. Из них почти одна пятая (18%) за год ни разу не встретилась в поисковых запросах к Яндексу. Примерно 38% слов упоминались в запросах, но отсутствовали в корпусе русского языка. В пересечение поиска и корпуса попали 44% слов.
18% слов из словаря Даля можно считать полностью вышедшими из употребления: в течение года люди ничего не искали с помощью этих слов и даже не спрашивали про их значение
.
Доля глаголов среди этих слов заметно больше, чем в словаре в целом, а доля существительных — меньше. Таким образом, глаголы из словаря Даля устаревают быстрее, чем существительные.
Около 85% ушедших глаголов содержат приставки. Самая распространённая, по-, встречается в каждом пятом случае, иногда в комбинации с другими приставками:
,
,
. Почти треть существительных оканчивается на -ье или -ие и означает действие по соответствующему глаголу:
,
,
. Много существительных на -чик, -чица, -ник, -ница и так далее. Часто они обозначают людей определённых занятий — как правило, эти занятия больше не актуальны или изменили название:
,
,
.
Вообще вышедшие из употребления слова часто образованы от корней, которые вполне используются и сейчас:
,
,
,
,
,
— сегодня так не говорят, но можно легко догадаться, что имеется в виду.
С двумя другими группами слов всё не так просто. Можно предположить, что та часть словаря Даля, которая есть и в поисковых запросах, и в текстах из корпуса русского языка (44%), — это живые слова. А 38%, которые есть в поиске, но отсутствуют в корпусе, — уходящие: их уже не используют в письменной речи, но иногда ищут в интернете. С другой стороны, вряд ли можно назвать живым слово, которое есть в письменных текстах, но встречается в запросах всего несколько раз в год, или слово, которое вводят в поиск только для того, чтобы узнать значение.
Кроме того, часть словаря могла попасть в поиск и корпус из-за омонимии: пишется так же, но значит другое. У Даля встречаются такие популярные в интернете слова, как
,
,
,
— но совсем в другом значении. Иногда написание слов у Даля совпадает с распространённой в поиске ошибкой или опечаткой —
,
,
,
. Также бывает, что слово ушло из русского языка, но сохранилось в украинском (
,
,
), или остались родственные ему фамилии и названия населённых пунктов (
,
,
).
Чтобы точнее определить, какая часть словаря Даля до сих пор жива, а какая вышла или выходит из употребления, мы оценили долю омонимии среди слов, встречавшихся в поисковых запросах, а также посчитали, сколько слов люди искали с целью узнать, что они значат.
Подробнее о методе оценки
Омонимами оказались почти треть изученных слов. Больше всего омонимов — почти 60% — среди тех слов, которые относительно часто, более 1000 раз в течение года, встретились в поисковых запросах, но при этом отсутствовали в текстах из корпуса. А среди таких слов с более высокой частотностью (больше 100 тысяч запросов за год) доля омонимов превысила 80%.
Всего около 8,5% слов из словаря Даля интересуют пользователей в первую очередь в контексте поиска значения. Из них самые популярные:
,
,
,
и
. Большая часть таких слов отсутствует в текстах из корпуса и мало распространена в запросах.
Теперь можно более точно распределить слова из словаря Даля между тремя главными группами: ушедшими, уходящими и живыми.
К вышедшим из употребления отнесли слова, которые ни разу не встретились ни в запросах, ни в текстах из корпуса русского языка, а также те, которые оказались там только из-за омонимии или по ошибке.
К словам, которые уходят из языка и употребляются сейчас крайне редко, причислили следующие:
- те, которые встретились в поисковых запросах менее 10 раз в год,
- те, которые сравнительно мало встречались в запросах — десятки или, в редких случаях, сотни раз за год, отсутствовали в корпусе, и для которых в интернете не удалось найти примеров употребления,
- те, которые искали в первую очередь для того, чтобы узнать значение.
Живыми считали все остальные слова, в том числе мало распространённые специальные термины (
,
,
) — вне зависимости от их частотности в поисковых запросах.
Примерно треть слов из словаря Даля (32%) распространены до сих пор. Ещё чуть меньше 30% — используются, но крайне мало, треть из них — только при поиске значений. Почти 40% слов, или полтора тома всего словаря Даля, полностью вышли из употребления.