Открытый список:Работа с дублями — различия между версиями
(Новая страница: «В базе данных "Открытого списка" содержится много повторов: одни и те же люди, из-за ошибк…») |
|||
| (не показаны 2 промежуточные версии этого же участника) | |||
| Строка 3: | Строка 3: | ||
При нажатии на эту кнопку вы получите две статьи, которые могут быть дублями. Отличаются они несколькими символами в названии - разным написанием фамилии, разницей в рождении в один-два года. Вам необходимо сравнить биографические данные из обоих статей и, в случае, если есть пересечения в датах, месте рождения или проживания, профессии, которые однозначно говорят о том, что перед нами две статьи про одного человека - нажмите кнопку "Дубль". Если данные говорят об обратном и перед вами два не связанных человека - нажмите кнопку "Не дубль". Если данных недостаточно для уверенного вывода - нажмите кнопку "Я не уверен". | При нажатии на эту кнопку вы получите две статьи, которые могут быть дублями. Отличаются они несколькими символами в названии - разным написанием фамилии, разницей в рождении в один-два года. Вам необходимо сравнить биографические данные из обоих статей и, в случае, если есть пересечения в датах, месте рождения или проживания, профессии, которые однозначно говорят о том, что перед нами две статьи про одного человека - нажмите кнопку "Дубль". Если данные говорят об обратном и перед вами два не связанных человека - нажмите кнопку "Не дубль". Если данных недостаточно для уверенного вывода - нажмите кнопку "Я не уверен". | ||
| − | + | ==Типовые примеры дублирования== | |
| − | + | ===Ошибка в имени=== | |
| − | Несколько арестов | + | Одни и те же люди часто фигурируют под разными именами и фамилиям. Причин этому несколько: запись в документе имени "со слуха", неверно разобранная рукописная буква, использования разных вариантов русификации национальных имен и пр. |
| + | |||
| + | В случае, если один и тот же человек фигурирует в списке под разными именами, необходимо свести вместе все статьи в одну, варианты имени, имеющие право на существования, перенести в раздел "Варианты ФИО", а явно ошибочные - удалить. | ||
| + | |||
| + | '''Примеры:''' | ||
| + | |||
| + | Абабакирова Деши (1955) и Абубакирова Деши (1955). Поиск в интернете не помог нам определить верное написание фамилии, но показал, что форма "Абубакирова" встречается в 40 раз чаще. Мы оставляем названием статьи более частотный вариант имени, а имя Абабакирова Деши перемещаем в графу "Варианты ФИО" левой колонки. | ||
| + | |||
| + | |||
| + | |||
| + | ===Ошибка в дате рождения=== | ||
| + | |||
| + | Информация о людях, попадающая в ОС, | ||
| + | Рукописное написание числительных оставляет много возможностей | ||
| + | ===Несколько арестов=== | ||
| + | |||
| + | Часто, если на человека заведено несколько дел, в "ОС" на каждый арест создавалась отдельная статья. Если вы видите, что биографические данные совпадают, а даты в аресте разнятся, скорее всего речь идет о втором аресте. Вам необходимо перенести все данные в левую колонку, так, чтобы самый хронологически ранний арест стал первым, следующий - вторым и т.д. | ||
| + | |||
| + | ==Объединение разделов== | ||
| + | |||
| + | Категории | ||
Текущая версия на 17:14, 18 августа 2016
В базе данных "Открытого списка" содержится много повторов: одни и те же люди, из-за ошибки (в имени или дате рождения) или из-за нескольких осуждений в разных регионах СССР, оказываются учтены в списке несколько раз. Нам необходимо избавиться от дублирования, сведя информацию про одного человека на одной странице.
При нажатии на эту кнопку вы получите две статьи, которые могут быть дублями. Отличаются они несколькими символами в названии - разным написанием фамилии, разницей в рождении в один-два года. Вам необходимо сравнить биографические данные из обоих статей и, в случае, если есть пересечения в датах, месте рождения или проживания, профессии, которые однозначно говорят о том, что перед нами две статьи про одного человека - нажмите кнопку "Дубль". Если данные говорят об обратном и перед вами два не связанных человека - нажмите кнопку "Не дубль". Если данных недостаточно для уверенного вывода - нажмите кнопку "Я не уверен".
Содержание
Типовые примеры дублирования
Ошибка в имени
Одни и те же люди часто фигурируют под разными именами и фамилиям. Причин этому несколько: запись в документе имени "со слуха", неверно разобранная рукописная буква, использования разных вариантов русификации национальных имен и пр.
В случае, если один и тот же человек фигурирует в списке под разными именами, необходимо свести вместе все статьи в одну, варианты имени, имеющие право на существования, перенести в раздел "Варианты ФИО", а явно ошибочные - удалить.
Примеры:
Абабакирова Деши (1955) и Абубакирова Деши (1955). Поиск в интернете не помог нам определить верное написание фамилии, но показал, что форма "Абубакирова" встречается в 40 раз чаще. Мы оставляем названием статьи более частотный вариант имени, а имя Абабакирова Деши перемещаем в графу "Варианты ФИО" левой колонки.
Ошибка в дате рождения
Информация о людях, попадающая в ОС, Рукописное написание числительных оставляет много возможностей
Несколько арестов
Часто, если на человека заведено несколько дел, в "ОС" на каждый арест создавалась отдельная статья. Если вы видите, что биографические данные совпадают, а даты в аресте разнятся, скорее всего речь идет о втором аресте. Вам необходимо перенести все данные в левую колонку, так, чтобы самый хронологически ранний арест стал первым, следующий - вторым и т.д.
Объединение разделов
Категории
