-
Notifications
You must be signed in to change notification settings - Fork 0
Description
Цель
Собрать данные об армянских промышленных патентах.
Задачи
Чтобы собрать данные со страницы https://aipo.am/ru/search-int-classification, нужно иметь какой-то исчерпывающий принцип, по которому можно извлечь все записи. Таким принципом представляется классификатор Международная классификация промышленных образцов (МКПО) (https://classinform.ru/mkpo.html), коды из которого можно использовать для подбора записей. Предположительно, по итогам применения всех кодов, можно будет получить все записи, которые может предложить сервис.
Фактически для каждого из кодов МКПО нужно получить список найденных записей. Из этого списка следует получить ID каждой записи ("Номер свидетельства"). Затем этот ID можно использовать при формировании ссылки на подробное описание каждой записи (в веб-интерфейсе появляется во вспомогательном окне). Эти данные нужно собрать в набор в открытом машиночитаемом формате (JSON, XML, CSV). В случае, когда данные доступны на нескольких языках (а такое бывает), желательно собрать варианты для всех языков.
В описаниях, помимо текста, присутствуют также изображения. С ними можно поступить двояко:
- можно собрать только ссылки на эти изображения;
- можно собрать сами изображения и сохранить их в архивированной папке, передав затем проекту Opendata.am (мы сохраним данные у себя на сервере, так что место на вашем диске это будет занимать недолго). В таком случае нужно будет добавить в данные для каждого изображения также относительный путь к этому изображению в этой папке.
Сервис доступен на армянском, русском и английском языках.
Контекст
Агентство интеллектуальной собственности Республики Армения публикует данные о патентах (https://aipo.am/ru/search-int-classification). Проблема в том, что там доступен только поиск, сполучить список патентов по какому-либо заданному признаку невозможно. Собрав эти данные, их можно использовать (со ссылкой на источник, разумеется) для разного рода аналитики, недоступной при посредстве интерфейса на сайте публикатора.
Требования
Нужно создать публичный репозиторий на Гитхабе, в котором будут храниться код и данные, опубликованные по свободной и открытой лицензии, например Creative Commons или MIT.
Пожелания
Будет хорошо, если ваш код можно будет использовать повторно. Например, если кто-нибудь захочет запустить его у себя, чтобы обновить набор данных когда-нибудь в будущем. По этой причине мы просим вас прокомментировать свой код и сопроводить его хотя бы коротким описанием в README. Также полезно было бы указать все зависимости и требования, необходимые для использования вашего кода.
Ресурсы
https://aipo.am/ru/search-int-classification - собственно страница с данными
https://classinform.ru/mkpo.html - справочник МКПО
Авторы задачи
Задачу подготовила команда Open Data Armenia.