Базы данных c: Как программы на Си взаимодействуют с сервером БД PostgreSQL::Журнал СА 10.2005
Содержание
Базы данных — всё по этой теме для программистов
Как мы в «Кнопке» подходим к резервированию данных
Мы не можем потерять данные бухгалтерии 1500 пользователей, которые нам доверяют. Рассказываем, что мы делаем для резервирования данных.
Взаимодействие Python и FugueSQL в Jupyter Notebooks
FugueSQL — это язык который расширяет возможности SQL. Рассказываем, как пользоваться FugueSQL в связке с Python и Jupyter Notebooks.
Индексы в PostgreSQL
На примере PostgreSQL коротко рассматриваем несколько разных типов индексов и классов задач, для которых они применимы.
Задачи с собеседований: обработка параллельного редактирования данных
Разбор задачи, в которой нужно обеспечить непротиворечивость данных при параллельном редактировании несколькими пользователями.
Основные команды SQL, которые должен знать каждый программист
Рассмотрим основные команды SQL, включая агрегатные функции и вложенные подзапросы, на примере работы с MySQL.
27 распространённых вопросов по SQL с собеседований и ответы на них
Вопросы по SQL часто входят в техническое собеседование. Здесь мы собрали популярные вопросы, задачи и дали на них развёрнутые ответы.
Как спроектировать базу данных, чтобы в будущем не пришлось её переписывать — базовые советы
Если вы работаете с базами данных, мало просто выучить SQL — нужно ещё и правильно спроектировать БД. Рассказываем о базовых правилах и возможных ошибках.
Хранимые процедуры на Python в PostgreSQL
Рассматриваем несколько простых примеров, чтобы научиться работать с хранимыми процедурами PostgreSQL на Python.
Трансляция HighLoad++ 2019
В программе: архитектура и эксплуатация проектов, базы данных и системы хранения, системное администрирование, нагрузочное тестирование и не только.
Знакомство с InfluxDB и базами данных временных рядов
Статья расскажет о том, что такое базы данных временных рядов и в частности про InfluxDB. Будут рассмотрены основные концепции, а также некоторые тонкости.
Работа с данными по-новому: Pandas вместо SQL
Статья покажет, как переписать SQL-запросы для Pandas и многое другое. Эта библиотека хорошо подходит для структурированных данных.
Меняем схему базы данных в PostrgreSQL, не останавливая работу приложения
Рассказываем, как обновить схему баз данных, когда приостановка для технических работ недопустима — даже если речь идёт о минутах..
Разбираемся в типах NoSQL СУБД
В этой статье мы познакомимся с 4 основными типами NoSQL баз данных: ключ-значение, документоориентированной, колоночной и графовой.
Фичи Django ORM, о которых вы не знали
Разработчики, решившие более детально разобраться в работе СУБД, часто обнаруживают, что делает некоторые вещи не оптимально. Представляем вашему вниманию советы по работе с базами данных в Django ORM.
15 полезных команд PostgreSQL
В сети много руководств по PostgreSQL, которые описывают основные команды. Но при погружении в работу возникают такие практические вопросы, для которых требуются продвинутые команды. Рассмотрим несколько таких команд на примерах, полезных как для разработчиков, так и для администраторов баз данных.
Курс «Хранилища данных»
Русскоязычный курс от НОУ ИНТУИТ, рассматривающий принципы построения систем, ориентированных на анализ данных, а также различные модели данных, используемых для построения хранилищ данных.
«Use the index, Luke»: подборка книг по SQL и теории баз данных
SQL (англ. structured query language — «язык структурированных запросов») — язык программирования, применяемый для создания, модификации и управления данными в реляционной базе данных, управляемой соответствующей системой управления базами данных. Появился в 1974 году как язык…
Курс «Технологии хранения и обработки больших объёмов данных»
Русскоязычный курс, посвящённый теоретическим и практическим вопросам работы с технологиями, связанным с хранением, обработкой и анализом больших объёмов данных. Курс записан в 2015 году, лектор — Дмитрий Барашев.
Курс «Проектирование СУБД»
Совместный видеокурс «Технотрек Mail.Ru Group» и МФТИ, посвященный изучению основ языка SQL с учетом особенностей объектно-реляционной СУБД PostgreSQL. Курс записан в 2016 году, лекторы курса — Данил Вагапов и Елена Шишкина.
Курс «Изучение программирования. SQL»
Курс-введение в SQL — язык манипулирования данными, а также в теоретические основы проектирования реляционных баз данных.
Инструкция: как перевести проект Django с SQLite на MySQL без боли
SQLite3 является СУБД-движком по умолчанию в Python веб-фреймворке Django, а также, как сообщается на официальном сайте проекта, самым часто используемым движком в мире. И он отлично походит для быстрого прототипирования…
Основные аспекты безопасности СУБД: что следует знать
Внутренняя операционная информация компании, персональные данные сотрудников, финансовая информация, информация о заказчиках и клиентах, интеллектуальная собственность, исследования рынка, анализ деятельности конкурентов, платежная информации — это сведения, которые чаще всего интересуют…
SQLite, MySQL и PostgreSQL: сравниваем популярные реляционные СУБД
Реляционные базы данных используются уже очень давно. Они стали популярными благодаря успешным реализациям реляционных моделей в системах управления, оказавшимся весьма удобными для работы с данными. В этой статье мы сравним…
SQL и NoSQL: разбираемся в основных моделях баз данных
С незапамятных времен память была одной из самых важных и необходимых составляющих компьютера. Несмотря на разницу в методах реализации, большинство вычислительных машин оснащены необходимым аппаратным обеспечением для обработки и хранения…
Избегаем часто встречающихся ошибок при работе с MySQL
Работа с базой данных — зачастую самое слабое место в производительности многих web-приложений. И часто можно заметить, как на одни и те же грабли наступают разработчики при проектировании базы данных. Данная…
Как использовать базу данных MySQL в Java
В этой статье мы научимся подключаться к базе данных MySQL из Java-кода и выполнять простые запросы для получения и обновления данных. Для того, чтобы получить доступ к базе данных, мы…
ГК РФ Статья 1334. Исключительное право изготовителя базы данных / КонсультантПлюс
Перспективы и риски арбитражных споров. Ситуации, связанные со ст. 1334 ГК РФ |
— Правообладатель базы данных хочет взыскать компенсацию за нарушение исключительного права на нее
1. Изготовителю базы данных, создание которой (включая обработку или представление соответствующих материалов) требует существенных финансовых, материальных, организационных или иных затрат, принадлежит исключительное право извлекать из базы данных материалы и осуществлять их последующее использование в любой форме и любым способом (исключительное право изготовителя базы данных). Изготовитель базы данных может распоряжаться указанным исключительным правом. При отсутствии доказательств иного базой данных, создание которой требует существенных затрат, признается база данных, содержащая не менее десяти тысяч самостоятельных информационных элементов (материалов), составляющих содержание базы данных (абзац второй пункта 2 статьи 1260).
Никто не вправе извлекать из базы данных материалы и осуществлять их последующее использование без разрешения правообладателя, кроме случаев, предусмотренных настоящим Кодексом. При этом под извлечением материалов понимается перенос всего содержания базы данных или существенной части составляющих ее материалов на другой информационный носитель с использованием любых технических средств и в любой форме.
2. Исключительное право изготовителя базы данных признается и действует независимо от наличия и действия авторских и иных исключительных прав изготовителя базы данных и других лиц на составляющие базу данных материалы, а также на базу данных в целом как составное произведение.
3. В течение срока действия исключительного права на базу данных правообладатель по своему желанию может зарегистрировать базу данных в федеральном органе исполнительной власти по интеллектуальной собственности. К такой регистрации применяются правила статьи 1262 настоящего Кодекса.(п. 3 в ред. Федерального закона от 12.03.2014 N 35-ФЗ)
(см. текст в предыдущей редакции
)
Открыть полный текст документа
Какие бывают базы данных — Журнал «Код»: программирование без снобизма
Базы данных — это способ упорядочить информацию так, чтобы компьютер мог с ней легко работать, а человек мог пользоваться этими данными как ему удобно. Мы уже писали о базах данных в общем, теперь углубимся.
👉 Это знания скорее из области информатики, чем прикладного программирования. Если вы просто делаете сайты или обслуживаете интернет-магазин, вероятнее всего, вам из этого понадобятся только реляционные базы данных. Но когда вы захотите сделать более сложные приложения — например рекомендации товаров, — вам потребуются знания о других типах баз.
Считайте, что эта статья для расширения кругозора.
Три основных типа
В зависимости от того, какие данные нужно в ней хранить и как с ними работать, базы делятся на реляционные и нереляционные:
Реляционные
Реляционные базы данных ещё называют табличными, потому что все данные в них можно представить в виде разных таблиц. Одни таблицы связаны с другими, а другие — с третьими. Например, база данных покупок в магазине может выглядеть так:
Смотрите, у магазина есть две таблицы — с товарами и покупателями. Но когда один из них что-то покупает, то данные попадают в третью таблицу. В ней есть своя информация (количество купленных товаров) и ссылки на покупателя и сам товар. Если нужно, можно по этим связям попасть в нужную таблицу и узнать подробности о той или другой записи.
Если у покупателя поменяется номер телефона, то нам достаточно будет поменять это в одной таблице «Клиенты». Благодаря тому, что в «Покупки» записывается только код покупателя, нам не нужно менять имя больше нигде — данные сами обновятся автоматически, когда мы захотим посмотреть, кто именно купил табурет.
Сетевые
В отличие от реляционных баз, в сетевых между таблицами и записями может быть несколько разных связей, каждая из который отвечает за что-то своё.
Если мы возьмём базу данных с сайта Кинопоиска, то она может выглядеть так:
Особенность сетевой базы данных в том, что в ней запоминаются все связи и всё содержимое для каждой связи. Базе не нужно тратить время на поиск нужных данных, потому что вся информация об этом уже есть в специальных индексных файлах. Они показывают, какая запись с какой связана, и быстро выдают результат.
Например, вы посмотрели «Начало» Кристофера Нолана и вам понравился этот фильм. Когда вы перейдёте к списку фильмов, которые он ещё снял, база на сайте сделает так:
- возьмёт имя режиссёра;
- посмотрит, какие связи и с чем у него есть;
- выдаст список фильмов;
- к этим фильмам может сразу подгрузить список актёров, которые там играют;
- и сразу же показать постеры к каждому фильму.
А главное — база сделает это очень быстро, потому что ей не нужно просматривать всю базу в поисках нужных фильмов. Она сразу видит, какие фильмы с чем связаны, и выдаёт ответ.
Иерархические
Иерархия — это когда есть вышестоящий, а есть его подчинённые, кто ниже. У них могут быть свои подчинённые и так далее. Мы уже касались такой модели, когда говорили про деревья и бустинг.
В такой базе данных сразу видно, к чему относятся записи, где они лежат и как до них добраться. Самый простой пример такой базы данных — хранение файлов и папок на компьютере:
Видно, что на диске C: есть много папок: Dropbox, eSupport, GDrive и все те, которые не поместились на экране.
Внутри папки GDrive есть ###_Inbox и #_Альбатрос, а внутри #_Альбатроса — десятки других папок. Если мы посмотрим на скриншот, то увидим, то должностная инструкция бухгалтера лежит с остальными файлами внутри папки Должностные и охрана труда, которая лежит внутри папки Инструкции.
Иерархическая база данных знает, кто кому подчиняется, и поэтому может быстро находить нужную информацию. Но такие базы можно организовать только в том случае, когда у вас есть чёткое разделение в данных, что главнее, а что ему подчиняется.
Главное о базах данных
- Чаще всего базы данных напоминают таблицы: в них одному параметру соответствует один набор данных. Например, один клиент — одно имя, один телефон, один адрес.
- Такие «табличные» базы данных называются реляционными.
- Чтобы строить сложные связи, разные таблицы в реляционных базах можно связывать между собой: ставить ссылки.
- Реляционная база — не единственный способ хранения данных. Есть ситуации, когда нам нужна большая гибкость в хранении.
- Бывают сетевые базы данных: когда нужно хранить много связей между множеством объектов. Например, каталог фильмов: в одном фильме может участвовать много человек, а каждый из них может участвовать во множестве фильмов.
- Бывают иерархические базы, или «деревья». Пример — наша файловая система.
- Какую выбрать базу — зависит от задачи. Одна база не лучше другой, но они могут быть более или менее подходящими для определённых задач.
Текст и иллюстрации
Миша Полянин
Редактор
Максим Ильяхов
Корректор
Ира Михеева
Иллюстратор
Даня Берковский
Вёрстка
Маша Дронова
Доставка
Олег Вешкурцев
Что-то делает руками
Паша Федоров
Во славу
Практикума
Работа с базой данных
Модель работы с базой данных
Модель базы данных «1С:Предприятия 8» имеет ряд особенностей, отличающих ее от классических моделей систем управления базами данных (например, основанных на реляционных таблицах), с которыми имеют дело разработчики в универсальных системах.
Основное отличие заключается в том, что разработчик «1С:Предприятия 8» не обращается к базе данных напрямую. Непосредственно он работает с платформой «1С:Предприятия 8». При этом он может:
- описывать структуры данных в конфигураторе,
- манипулировать данными с помощью объектов встроенного языка,
- составлять запросы к данным, используя язык запросов.
Платформа «1С:Предприятия 8» обеспечивает операции исполнения запросов, описания структур данных и манипулирования данными, транслируя их в соответствующие команды. Это могут быть команды системы управления базами данных, в случае клиент-серверного варианта работы, или команды собственного движка базы данных для файлового варианта.
Общая система типов
Важной особенностью работы с базой данных является то, что в «1С:Предприятии 8» реализована общая система типов языка и полей баз данных. Иными словами, разработчик одинаковым образом определяет поля базы данных и переменные встроенного языка и одинаковым образом работает с ними.
Этим система «1С:Предприятие 8» выгодно отличается от универсальных инструментальных средств. Обычно, при создании бизнес-приложений с использованием универсальных сред разработки, используются отдельно поставляемые системы управления базами данных. А это значит, что разработчику приходится постоянно заботиться о преобразованиях между типами данных, поддерживаемыми той или иной системы управления базами данных, и типами, поддерживаемыми языком программирования.
Хранение ссылок на объекты
При манипулировании данными, хранящимися в базе данных «1С:Предприятия 8», зачастую используется объектный подход. Это значит, что обращение (чтение и запись) к некоторой совокупности данных, хранящихся в базе, происходит как к единому целому. Например, используя объектную технику, можно манипулировать данными справочников, документов, планов видов характеристик, планов счетов и т.д.
Характерной особенностью объектного манипулирования данными является то, что на каждый объект, как совокупность данных, существует уникальная ссылка, позволяющая однозначно идентифицировать этот объект в базе данных.
Эта ссылка также хранится в поле базы данных, вместе с остальными данными объекта. Кроме того, ссылка может быть использована как значение какого-либо поля другого объекта. Например, ссылка на объект справочника Контрагенты может быть использована как значение соответствующего реквизита документа Приходная накладная.
Составные типы
Существенной возможностью модели данных, которая поддерживается «1С:Предприятием 8», является то, что для поля базы данных можно определить сразу несколько типов данных, значения которых могут храниться в этом поле. При этом значение в каждый момент времени будет храниться одно, но оно может быть разных типов — как ссылочных, так и примитивных — число, строка, дата и т.п.:
Такая возможность очень важна для экономических задач — например, в расходной накладной в качестве покупателя может быть указано либо юридическое лицо из справочника организаций, либо физическое лицо из справочника частных лиц. Соответственно, при проектировании базы данных разработчик может определить поле, которое будет хранить значение любого из этих типов.
Хранение любых данных как Хранилище значения
Идеология создания прикладных решений в «1С:Предприятии 8» предполагает, что все файлы, имеющие отношение к данному прикладному решению, нужно хранить в самой базе данных.
Для этого введен специальный тип данных — ХранилищеЗначения. Поля базы данных могут хранить значения такого типа, а встроенный язык содержит специальный одноименный объект, позволяющий преобразовывать значения других типов к специальному формату Хранилища значений.
Благодаря этому разработчик имеет возможность сохранять в базе данных значения, тип которых не может быть выбран в качестве типа поля базы данных, например, графические изображения.
Создание и обновление структур данных на основе метаданных
В процессе создания или модификации прикладного решения разработчик избавлен от необходимости каких-либо действий по непосредственному изменению структуры полей базы данных прикладного решения.
Разработчику достаточно путем визуального конструирования описать структуру используемых объектов прикладного решения, состав их реквизитов, табличных частей, форм и пр.
Все действия по созданию или изменению структуры таблиц базы данных платформа выполнит самостоятельно, на основании состава объектов прикладного решения и их характеристик.
Например, для того, чтобы в справочнике сотрудников появилась возможность хранить сведения о составе семьи сотрудника, разработчику «1С:Предприятия 8» не нужно создавать в базе данных специальную новую таблицу, задавать правила, по которым данные, хранящиеся в этой таблице, будут связаны с данными из основной таблицы, программировать алгоритмы совместного доступа к данным этих таблиц, создавать алгоритмы проверки прав доступа к данным, находящимся в подчиненной таблице и пр.
Все, что требуется сделать разработчику — щелчком мыши добавить к справочнику табличную часть и задать два ее строковых реквизита: Имя и Родство. При сохранении или обновлении конфигурации платформа самостоятельно выполнит реорганизацию структуры базы данных, создаст необходимые таблицы и т.д.
Объектный / табличный доступ к данным
Штатной возможностью «1С:Предприятия 8» является поддержка двух способов доступа к данным — объектного (для чтения и записи) и табличного (для чтения).
В объектной модели разработчик оперирует объектами встроенного языка. В этой модели обращения к объекту, например документу, происходят как к единому целому — он полностью загружается в память, вместе с вложенными таблицами, к которым можно обращаться средствами встроенного языка как к коллекциям записей и т.д.
При манипулировании данными в объектной модели обеспечивается сохранение целостности объектов, кэширование объектов, вызов соответствующих обработчиков событий и т.д.
В табличной модели все множество объектов того или иного класса представляется как совокупность связанных между собой таблиц, к которым можно обращаться при помощи запросов — как к отдельной таблице, так и к нескольким таблицам во взаимосвязи:
В этом случае разработчик получает доступ к данным сразу нескольких объектов, что очень удобно для анализа больших объемов данных, например, при создании отчетов. Однако в силу того, что данные, выбираемые таким способом, содержат не все, а лишь некоторые реквизиты анализируемых объектов, табличный способ доступа не позволяет изменять эти данные.
Создание базы данных
Создание базы данных
Чтобы связать модель с базой данных, нужно вначале создать объект
База данных
– элемент модели AnyLogic, который будет соответствовать реальной базе данных и обеспечивать взаимодействие с ней. Создавая такой объект, вы открываете вашей модели доступ к определенной базе данных.
Чтобы создать объект База данных
- Перетащите элемент
База данных
из палитры
Внешние данные
на диаграмму агента (или эксперимента). - В панели
Свойства, задайте
Имя
этого элемента. Это имя будет использоваться для идентификации элемента и доступа к нему из кода. Оно не связано с именем файла базы данных, с которым будет работать данный объект.
После того, как объект
База данных
будет добавлен в вашу модель, нужно связать его с базой данных, с которой вы хотите работать (это может быть как файл базы данных, так и источник данных ODBC). Различные типы баз данных связываются по-разному. AnyLogic позволяет пользователям
устанавливать соединение с базами данных с помощью драйверов ODBC. Но поскольку большой популярностью пользуются базы данных MS Access, MS Excel, и MS SQL Server, AnyLogic предоставляет встроенную поддержку этих типов баз данных для облегчения
интеграции с ними.
Чтобы связать объект
База данных
с базой данных, следуйте изложенным ниже инструкциям (они несколько отличаются в зависимости от типа базы данных):
Связывание с базой данных MS Access
Пожалуйста, обратите внимание, что вы можете интегрировать вашу модель с базой данных MS Access только если на вашем компьютере установлен MS Office той же разрядности (32 или 64 бита), что и AnyLogic. 32-битная версия AnyLogic требует 32-битной
версии MS Office, а 64-битная версия AnyLogic будет работать только с 64-битной версией MS Office.
Чтобы интегрировать вашу модель с базой данных MS Access, вам нужно будет связать ваш объект с соответствующим файлом. Этот подход очень прост, но его недостатком является то, что в модели хранится полный путь к файлу базы данных. Поэтому если вы
измените местоположение этого файла, то вам будет нужно также самостоятельно изменить соответствующий путь к нему, заданный в свойствах объекта
База данных.
Чтобы связать
объект
AnyLogic «База данных»
с базой данных MS Access
- Выберите объект
База Данных, который вы хотите связать с базой данных, заданной файлом MS Access. - В панели
Свойства, выберите
Excel/Access
из выпадающего списка
Тип. - Выберите файл базы данных, с которым вы хотите связать объект
База Данных. Щелкните по кнопке
Выбрать
и в открывшемся диалоговом окне выберите файл базы данных MS Access, с которым вы хотите работать, и щелкните по кнопке
Открыть.
Для того, чтобы вы могли начать работу с базой данных (уже после того, как вы добавите на диаграмму элемент AnyLogic
База данных
и свяжете его с этой базой данных), вам нужно будет
установить с ней соединение.
Связывание с базой данных MS SQL Server
Чтобы связать объект
AnyLogic «База данных» с базой данных
MS SQL Server
- Выберите объект
База Данных, который вы хотите связать с базой данных MS SQL Server. - В панели
Свойства, выберите
Сервер Microsoft SQL
из выпадающего списка
Тип. - Задайте имя компьютера-хоста в поле
Хост
и имя базы данных, к которой вы хотите получить доступ, в поле
Имя базы данных. - Введите
Логин
и
Пароль, если они требуются для работы с этой базой данных.
Для того, чтобы вы могли начать работу с базой данных (уже после того, как вы добавите на диаграмму элемент AnyLogic
База данных
и свяжете его с этой базой данных), вам нужно будет
установить с ней соединение.
Связывание с другими базами данных посредством драйверов ODBC
Другой способ связывания источника данных с базой данных состоит в связывании его с источником данных ODBC. В этом случае используются драйверы ODBC, делающие модель независимой от типа и местоположения базы данных.
Чтобы связать объект
AnyLogic «База данных» с другим типом базы данных с помощью драйвера
ODBC
- Выберите объект
База Данных, который вы хотите связать с базой данных. - В панели
Свойства, выберите
Другая база данных
из выпадающего списка
Тип. - Выберите из выпадающего списка
Драйвер JDBC, какой драйвер JDBC вы будете использовать. Пожалуйста, обратите внимание, что выбранный драйвер должен быть установлен в вашей системе, иначе этот механизм работать не будет. Информацию об
установке драйвера вы сможете найти в документации, поставляемой вместе с ним. - Введите
URL соединения
для данного JDBC драйвера. Синтаксис строки зависит от того, какой драйвер вы используете (за подробной информацией, пожалуйста, снова обратитесь к документации драйвера). - Введите
Логин
и
Пароль, если они требуются для работы с этой базой данных.
Для того, чтобы вы могли начать работу с базой данных (уже после того, как вы добавите на диаграмму элемент AnyLogic
База данных
и свяжете его с этой базой данных), вам нужно будет
установить с ней соединение.
Соединение с базой данных
Установить соединение между элементом AnyLogic
База данных
и базой данных можно с помощью
программного интерфейса элемента
База данных. Кроме того, AnyLogic предоставляет возможность автоматического соединения с базой данных при запуске модели.
Чтобы установить соединение с базой данных при запуске модели
- В панели
Свойства
элемента
База данных, установите флажок
Соединить при запуске. AnyLogic попробует установить соединение с базой данных при запуске модели.
Не удается найти страницу | Autodesk Knowledge Network
(* {{l10n_strings.REQUIRED_FIELD}})
{{l10n_strings.CREATE_NEW_COLLECTION}}*
{{l10n_strings.ADD_COLLECTION_DESCRIPTION}}
{{l10n_strings.COLLECTION_DESCRIPTION}}
{{addToCollection.description.length}}/500
{{l10n_strings.TAGS}}
{{$item}}
{{l10n_strings.PRODUCTS}}
{{l10n_strings.DRAG_TEXT}}
{{l10n_strings.DRAG_TEXT_HELP}}
{{l10n_strings.LANGUAGE}}
{{$select.selected.display}}
{{article.content_lang.display}}
{{l10n_strings.AUTHOR}}
{{l10n_strings.AUTHOR_TOOLTIP_TEXT}}
{{$select.selected.display}}
{{l10n_strings.CREATE_AND_ADD_TO_COLLECTION_MODAL_BUTTON}}
{{l10n_strings.CREATE_A_COLLECTION_ERROR}}
В сети обнаружена база данных с 26 млн паролей от популярных сайтов
В сети была обнаружена крупная база данных, содержащая в себе десятки миллионов паролей для входа в популярные сервисы Facebook, Twitter, Amazon, Gmail и другие. Сообщается, что вся информация была собрана неизвестным вирусом, чье происхождение пока не установлено. Как злоумышленники могут использовать подобные сливы и как проверить, не скомпрометирован ли ваш пароль — выясняла «Газета.Ru».
ИБ-исследователи компании NordLocker сообщили о выявлении в открытом доступе базы данных объемом свыше 1,2 ТБ, содержащей в себе персональную информацию о пользователях со всего мира, передает портал Ars Technica.
В базе можно обнаружить пары логин-пароль, куки-файлы, данные автозаполнения, а также платежную информацию — все это было похищено при помощи неизвестного вируса, происхождение которого еще предстоит установить.
Речь идет о 26 млн паролей, 1,1 млн уникальных электронных адресов и 6,6 млн различных документов.
Сообщается, что некоторые пользователи хранили свои секретные комбинации в файлах формата .txt, созданных при помощи приложения «Блокнот», — то есть в незащищенном виде.
Вредоносное ПО не только собирало данные с компьютера жертвы, но и делало скриншот экрана, а также снимок с веб-камеры. Известно, что оно было активно в период с 2018 по 2020 год и заразило порядка 3 млн систем.
Пароли, находящиеся в этой базе, подходят для доступа к миллиону популярных сайтов мира, в том числе для Facebook, Twitter, Amazon и Gmail. Агрегатор утечек Have I Been Pwned уже был обновлен в соответствии с новостями, пользователям рекомендуют проверить свой адрес электронной почты, используемый для входа на разные онлайн-платформы, чтобы узнать, не стали ли они жертвой загадочного вируса. В случае, если почта была скомпрометирована, нужно немедленно сменить ее пароль.
Украденные данные, позволяющие установить личность, могут быть использованы против жертвы в ходе целевого фишинга, обманов на основе социальной инженерии, а также для захвата учетных записей, в том числе с платной подпиской, сообщил «Газете.Ru» Тони Анскомб, главный ИБ-евангелист ESET.
«Опасность хранилищ персональных данных в том, что они остаются актуальными годами, и мошенники охотно приобретают их в даркнете. Велика вероятность, что за 3-5 лет вы не сменили номер телефона и e-mail, у вас все те же дата рождения и имя.
А если вы еще и пользуетесь одним или похожими простыми паролями много лет, то злоумышленник узнает достаточно, чтобы спланировать аферу.
Мошенник может начать контакт с SMS, подделанной под сообщение от магазина или сервиса, на который много лет подписана жертва. Дальше включаются приемы социальной инженерии на основе тех фактов, которые известны из утекших баз. Основная цель мошенников – заполучить от жертвы доступ или дополнительные данные, которые они затем смогут монетизировать», — заявил эксперт.
ИБ-евангелист компании Avast Луис Корронс в свою очередь отметил, что данные, обнаруженные NordLocker, не уникальны ни по количеству, ни по способу сбора, но кроме взлома учетных записей киберпреступники могут использовать их по-разному — например, для проведения Sextortion-кампаний, мошенничества, атак программ-вымогателями и для иных схем.
«Одной из обязательных целей любого вредоносного ПО в 90% случаев является негласный сбор информации с инфицированного устройства, а затем ее передача на управляющий сервер. Мошенники аккумулируют такие базы данных и затем торгуют ими на черном рынке скомпрометированной информации. Публикация еще одной большой базы данных ― обычная рыночная ситуация. Сейчас существует много компаний, которые занимаются аналитикой в области защиты информации. Они, в свою очередь, делают поисковые системы по таким базам, чтобы пользователь мог проверить, являются ли его данные или учетные записи скомпрометированными. Для пользователей масштабных рисков нет, но забывать про регулярную смену паролей и двухфакторную аутентификацию не стоит», — предупреждает Евгений Суханов, директор департамента информационной безопасности компании Oberon.
Какая база данных наиболее удобна для использования с языком C?
Какая база данных наиболее удобна для использования с языком C? — Переполнение стека
Присоединяйтесь к Stack Overflow , чтобы учиться, делиться знаниями и строить свою карьеру.
Спросил
Просмотрено
2k раз
В его нынешнем виде этот вопрос не подходит для нашего формата вопросов и ответов.Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, повлечет за собой дебаты, аргументы, опросы или расширенное обсуждение. Если вы считаете, что этот вопрос можно улучшить и, возможно, снова открыть, обратитесь за помощью в справочный центр.
Закрыт 8 лет назад.
У меня есть проект по «консультированию и поступлению в колледж» на языке C, и я не понимаю, выбрать ли для данных базу данных или систему управления файлами на C.Поскольку у меня нет предварительных знаний о подключении C к какой-либо из баз данных, а также потому, что я нахожу обработку файлов в C чем-то сложным.
Что бы вы порекомендовали?
Джонатан Леффлер
674k127127 золотых знаков822822 серебряных знака11
3 бронзовых знака
Создан 01 ноя.
нимшкиранверманимешкиранверма
1,30055 золотых знаков2525 серебряных знаков4747 бронзовых знаков
2
MYSQL имеет довольно хороший и простой интерфейс для использования с c.
Вы можете написать базовые операции в 30-40 строках кода c.
Обработка файлов не масштабируется и будет затруднена после изменения файловой структуры и информации. С помощью базы данных вы можете продолжать логически изменять свою информацию, добавляя новые таблицы, и по-прежнему повторно использовать большую часть кода, просто добавляя новые имена таблиц.
учебник MySQL c в среде Linux
Создан 01 ноя.
fklfkl
5,14844 золотых знака2424 серебряных знака6666 бронзовых знаков
Я бы использовал.plist и реализуйте его в UITableView, используя файлы .h и .m. Это самый простой и легкий способ сделать это. Вы можете продолжать добавлять строки в свой файл plist без необходимости также кодировать изменения!
Дайте мне знать, если у вас есть идея получше!
Создан 01 ноя.
2
язык-c
Stack Overflow лучше всего работает с включенным JavaScript
Ваша конфиденциальность
Нажимая «Принять все файлы cookie», вы соглашаетесь с тем, что Stack Exchange может хранить файлы cookie на вашем устройстве и раскрывать информацию в соответствии с нашей Политикой в отношении файлов cookie.
Принимать все файлы cookie
Настроить параметры
DB / C DX, DATABUS и PL / B Обзор
DB / C DX, DATABUS и PL / B Обзор
DB / C DX — это инструмент разработки программ для языка программирования DATABUS.
DB / C DX включает компилятор, исполнительную программу времени выполнения и восемнадцать утилит.
Утилиты предоставляют такие функции, как управление файлами, сортировка файлов,
индексирование файлов, управление библиотеками, редактирование исходного файла и многое другое. DB / C
DX доступен для множества различных компьютерных операционных систем.
включая персональные компьютеры на базе Windows XP через Win7, LINUX, большинство
Компьютерные системы UNIX и Apple Mac OS X.
Что такое DATABUS?
DATABUS — это компьютерный язык высокого уровня, предназначенный для ведения бизнеса.
ориентированные приложения.В некоторых отношениях DATABUS похож на COBOL, хотя
DATABUS содержит несколько сложных функций, которые недоступны
на COBOL или на других деловых языках. DATABUS используется для создания высокоэффективных
интерактивные приложения, содержащие удобный пользовательский интерфейс. ШИНА ДАННЫХ
также используется для создания программ обработки, которые имеют дело с большими данными
файлы, которые обычно встречаются в бизнес-приложениях.
DATABUS был создан Datapoint Corporation в начале 1970-х годов.До
В 1981 году Datapoint была единственной компанией, предоставившей компилятор DATABUS. С
то, по крайней мере, шесть других компаний написали и в настоящее время занимаются маркетингом
компиляторы для языка DATABUS.
DATABUS был принят в качестве стандарта ANSI в декабре 1994 года. В процессе
ему было присвоено название PL / B, потому что Datapoint отказалась отказаться от
товарный знак на имя DATABUS. Люди до сих пор обычно называют его DATABUS.
Зачем использовать DATABUS?
DATABUS всегда был языком, который легко выучить и использовать. Другой
языки, которые предлагают эти преимущества, обычно имеют мало операций и
ограничить функции, доступные программисту. DATABUS прост в использовании
из-за его структуры и удобочитаемости.
Синтаксис похож на английский и не требует запоминания загадочных символов.
Но пусть это вас не вводит в заблуждение — DATABUS содержит более 125 отдельных операций.
(называемые глаголами), которые предоставляют компетентному программисту арсенал
функции.Вот пример типичного кода DATABUS:
. . В ЭТОМ ФРАГМЕНТЕ КОДА PL / B БУДЕТ ИСКАТЬ . НОМЕР ТЕЛЕФОНА СОТРУДНИКА ПО НОМЕРУ СОТРУДНИКА . ПЕТЛЯ KEYIN «ВВЕДИТЕ НОМЕР СОТРУДНИКА:», EMPNUM ОСТАНОВИТЬ ЕСЛИ F3 ПРОЧИТАЙТЕ СОТРУДНИКА, РАБОТНИКА; ИМЯ, ТЕЛНУМ ЕСЛИ ВЫШЕ BEEP ДИСПЛЕЙ «НОМЕР СОТРУДНИКА НЕ В ФАЙЛЕ» ЕЩЕ ДИСПЛЕЙ "ИМЯ:", ИМЯ, "ТЕЛЕФОН:", ТЕЛНУМ ENDIF ПОВТОРИТЬ
Многие используемые сегодня бизнес-языки действительно были разработаны для мэйнфреймов.
пакетная работа или однопользовательская работа на ПК.Аспект нескольких пользователей
интерактивный доступ к общим файлам — это только надстройка для этих языков.
Однако DATABUS с самого начала проектировался для работы в интерактивном
многопользовательская среда.
Функции, доступные программисту для экрана и клавиатуры
управляемость отличная. Механизмы доступа к данным и блокировки — это время
протестированы и хорошо выдерживают высокие эксплуатационные характеристики при интенсивной эксплуатации.
DATABUS также является прекрасным дополнением к системам баз данных на базе SQL. Даже
хотя большинство систем баз данных SQL имеют встроенный 4GL, многие базы данных
приложения все еще пишутся на языке третьего поколения. В
причины для этого разные, но суть в том, что 4GL не поддерживает
предоставления программисту всех функций, которые третье поколение
язык обеспечивает. Когда выбор сводится к COBOL, C / C ++, Java, VB,
или DATABUS, многие разработчики выбирают DATABUS.
Вот некоторые из многих причин, по которым разработка в DATABUS лучше:
1. Компиляция происходит очень быстро, нет шага ссылки.
вообще.2. Отладка программы DATABUS значительно упрощается благодаря тому, что
язык полностью закрыт. Все переменные инициализируются автоматически.
Числовая переменная не может содержать или ей не может быть присвоено недопустимое значение. Там
не являются указателями, которые могут указывать в странные места, вызывая тонкие
и трудно найти ошибки.Нет наложения данных, которые могут вызвать данные
несоответствие типов. Программа DATABUS не может вызвать дамп памяти — это
просто невозможно.3. Помимо индексированного метода последовательного доступа, DATABUS предоставляет
другой метод доступа называется методом ассоциативного индекса. Обычно
называется AIM, этот метод доступа позволяет выполнять поиск ключей без контекста в
Дата файлы. Например, в файле инвентаризации деталей можно
получить все записи, содержащие слово «БОЛТ» в любом месте описания
поле.Слово может быть в верхнем, нижнем или смешанном регистре. В
программисту не нужно предварительно программировать или извлекать ключевые слова перед
lookup — поисковый метод AIM все делает за него.4. Глаголы ввода с клавиатуры и отображения экрана обеспечивают гораздо больше функций.
чем соответствующие функции на других языках. Отображение всплывающего окна
практически нетривиально реализовать. Показать атрибуты, такие как обратное видео,
подчеркивание, мигание и цвета указываются в глаголе DISPLAY с помощью
короткие, легко запоминающиеся коды.Программисту смотреть не надо
в другом разделе программы (или даже на отдельной карте экрана
модуль, как на некоторых других языках), чтобы выяснить, что отображается
на экране. В программе все нормально.
Почему я должен выбрать DB / C?
DB / C DX реализует все аспекты стандарта PL / B. DB / C DX также включает
утилиты, которые предоставляют все необходимые функции уровня операционной системы
используется вместе с программами DATABUS.
Наиболее важной особенностью DB / C DX для понимания является его портативность.
Ни один из существующих на сегодняшний день языков не обеспечивает лучшей переносимости, чем
DB / C DX. Причина, по которой мы можем сделать это заявление, проста:
Программы, скомпилированные под DB / C DX, могут запускаться на любом поддерживаемом
комп без перекомпиляции.
Этот уровень портативности дает вам беспрецедентные возможности
для запуска вашего программного обеспечения практически на любом компьютере по вашему выбору —
с гарантией корректной работы без каких-либо изменений программы
или другое вмешательство программиста.
Если в настоящее время у вас есть программы DATABUS, написанные для Datapoint RMS DATABUS
или DOS DATASHARE, перенос на DB / C DX выполняется быстро и просто. Определенный
особенности DB / C делают преобразование из диалектов Datapoint DATABUS
Полегче.
Использование DB / C DX, разработка и тестирование новых или существующих программ DATABUS
заметно улучшен по сравнению с другими компиляторами DATABUS.
Скорость компиляции обычно составляет сотни тысяч строк в минуту.В сочетании с отсутствием шага ссылки, общее время компиляции
быстрее, чем любой другой существующий компилируемый язык общего назначения. An
вся система, такая как система ввода заказов, состоящая из 50 программ
может быть скомпилирован менее чем за минуту на компьютере на базе Pentium. На
более дорогие системы UNIX, компиляция происходит еще быстрее.
Разумно ли выбирать DB / C DX?
да. DB / C DX был очень удачным выбором для многих компаний.Версия
1 был впервые установлен в 1983 году на однопользовательских компьютерах IBM. С тех пор многие
были выпущены дополнительные крупные обновления, которые улучшили DB / C DX
разными способами. DB / C DX в настоящее время установлен более чем в 1000 компаниях.
вокруг света.
Мы не можем найти эту страницу
(* {{l10n_strings.REQUIRED_FIELD}})
{{l10n_strings.CREATE_NEW_COLLECTION}} *
{{l10n_strings.ADD_COLLECTION_DESCRIPTION}}
{{l10n_strings.COLLECTION_DESCRIPTION}}
{{addToCollection.description.length}} / 500
{{l10n_strings.TAGS}}
{{$ item}}
{{l10n_strings.PRODUCTS}}
{{l10n_strings.DRAG_TEXT}}
{{l10n_strings.DRAG_TEXT_HELP}}
{{l10n_strings.LANGUAGE}}
{{$ select.selected.display}}
{{article.content_lang.display}}
{{l10n_strings.AUTHOR}}
{{l10n_strings.AUTHOR_TOOLTIP_TEXT}}
{{$ select.selected.display}}
{{l10n_strings.CREATE_AND_ADD_TO_COLLECTION_MODAL_BUTTON}}
{{l10n_strings.CREATE_A_COLLECTION_ERROR}}
GSDB: база данных трехмерных структур хромосом и генома, реконструированных из данных Hi-C | BMC Molecular and Cell Biology
de Laat W., Grosveld F. Пространственная организация экспрессии генов: активный концентратор хроматина.Chromosom Res. 2003. 11 (5): 447–59.
Google ученый
Деккер Дж. Генная регуляция в третьем измерении. Наука. 2008. 319 (5871): 1793–4.
CAS
PubMed
PubMed Central
Google ученый
Деккер Дж., Марти-Реном М.А., Мирный Л.А. Изучение трехмерной организации геномов: интерпретация данных взаимодействия хроматина. Nat Rev Genet. 2013; 14 (6): 390.
CAS
PubMed
PubMed Central
Google ученый
Миле А., Деккер Дж. Хромосомные взаимодействия на больших расстояниях и регуляция генов. Mol BioSyst. 2008. 4 (11): 1046–57.
CAS
PubMed
PubMed Central
Google ученый
де Вит Э, Де Лаат В. Десятилетие технологий 3C: понимание ядерной организации. Genes Dev. 2012; 26 (1): 11–24.
PubMed
PubMed Central
Google ученый
Zou C, Zhang Y, Ouyang Z. HSA: интеграция многодорожечных данных hi- C для реконструкции трехмерной структуры хроматина в масштабе генома. Genome Biol. 2016; 17 (1): 40.
PubMed
PubMed Central
Google ученый
Парк Дж., Лин С. Влияние разрешения данных на методы вывода трехмерной структуры. BMC Bioinformatics. 2016; 17 (1): 70.
PubMed
PubMed Central
Google ученый
Amann R, Fuchs BM. Идентификация отдельных клеток в микробных сообществах с помощью улучшенных методов флуоресцентной гибридизации in situ. Nat Rev Microbiol. 2008; 6 (5): 339.
CAS
PubMed
Google ученый
Langer-Safer PR, Levine M, Ward DC. Иммунологический метод картирования генов на политенных хромосомах дрозофилы. Proc Natl Acad Sci. 1982. 79 (14): 4381–5.
CAS
PubMed
Google ученый
Кремер Т., Кремер С. Хромосомные территории, ядерная архитектура и регуляция генов в клетках млекопитающих. Nat Rev Genet. 2001; 2 (4): 292.
CAS
PubMed
Google ученый
Westphal V, Rizzoli SO, Lauterbach MA, Kamin D, Jahn R, Hell SW. Оптическая наноскопия в дальней зоне с высокой частотой видео анализирует движение синаптических пузырьков. Наука. 2008. 320 (5873): 246–9.
CAS
PubMed
Google ученый
Руст MJ, Bates M, Zhuang X. Получение изображений с субдифракционным пределом с помощью микроскопии стохастической оптической реконструкции (STORM). Нат методы. 2006; 3 (10): 793.
CAS
PubMed
PubMed Central
Google ученый
Бетциг Э., Паттерсон Г.Х., Суграт Р., Линдвассер О.В., Оленич С., Бонифачино Д.С., Дэвидсон М.В., Липпинкотт-Шварц Дж., Хесс Х.Ф. Визуализация внутриклеточных флуоресцентных белков с нанометровым разрешением. Наука. 2006. 313 (5793): 1642–5.
CAS
PubMed
Google ученый
Хуанг Б., Бэбкок Х., Чжуан Х. Нарушение дифракционного барьера: визуализация клеток со сверхвысоким разрешением. Клетка. 2010. 143 (7): 1047–58.
CAS
PubMed
PubMed Central
Google ученый
Уильямсон И., Берливет С., Эскеланд Р., Бойл С., Иллингворт Р.С., Пакетт Д., Дости Дж., Бикмор В.А. Пространственная организация генома: контрастирующие взгляды на захват конформации хромосомы и флуоресцентную гибридизацию in situ.Genes Dev. 2014. 28 (24): 2778–91.
PubMed
PubMed Central
Google ученый
Деккер Дж., Риппе К., Деккер М., Клекнер Н. Захват конформации хромосом. Наука. 2002. 295 (5558): 1306–11.
CAS
PubMed
Google ученый
Simonis M, Klous P, Splinter E, Moshkin Y, Willemsen R, De Wit E, Van Steensel B, De Laat W. Ядерная организация активных и неактивных доменов хроматина, обнаруженная с помощью фиксации конформации хромосомы на чипе (4С).Нат Жене. 2006; 38 (11): 1348.
CAS
PubMed
Google ученый
Дости Дж., Ричмонд Т.А., Арнаут Р.А., Зельцер Р.Р., Ли В.Л., Хонан Т.А., Рубио Э.Д., Крамм А., Лэмб Дж., Нусбаум К., Грин Р.Д. Хромосомная конформация захватывает копию (5C): массивно-параллельное решение для картирования взаимодействий между геномными элементами. Genome Res. 2006. 16 (10): 1299–309.
CAS
PubMed
PubMed Central
Google ученый
Либерман-Эйден Э., Ван Беркум Н.Л., Вильямс Л., Имакаев М., Рагоци Т., Теллинг А., Амит I, Ладжуа Б.Р., Сабо П.Дж., Доршнер М.О., Сандстрем Р. Комплексное картирование взаимодействий на больших расстояниях раскрывает принципы складывания человеческого тела. геном. Наука. 2009. 326 (5950): 289–93.
CAS
PubMed
PubMed Central
Google ученый
Калхор Р., Тджонг Х., Джаятилака Н., Альбер Ф., Чен Л. Архитектура генома, выявленная с помощью захвата привязанной хромосомной конформации и популяционного моделирования.Nat Biotechnol. 2012; 30 (1): 90.
CAS
Google ученый
Фулвуд М.Дж., Лю М.Х., Пан Ю.Ф., Лю Дж., Сюй Х., Мохамед Ю.Б., Орлов Ю.Л., Велков С., Хо А., Мей П.Х., Чу Э.Г. Связанный с рецептором эстрогена α-связанный хроматин человека. Природа. 2009; 462 (7269): 58.
CAS
PubMed
PubMed Central
Google ученый
Ли Г., Фулвуд М.Дж., Сюй Х., Мулавади Ф.Х., Велков С., Вега В., Арияратне П.Н., Мохамед Ю.Б., Оои Х.С., Теннакун С., Вей К.Л.Инструмент ChIA-PET для всестороннего анализа взаимодействия хроматина с секвенированием парных концевых меток. Genome Biol. 2010; 11 (2): R22.
PubMed
PubMed Central
Google ученый
Trieu T, Oluwadare O, Wopata J, Cheng J. GenomeFlow: комплексный графический инструмент для моделирования и анализа трехмерной структуры генома. Биоинформатика. 2018; 35 (8): 1416–18.
Trieu T, Cheng J. Трехмерное моделирование структуры генома с помощью лоренцевой целевой функции.Nucleic Acids Res. 2016; 45 (3): 1049–58.
PubMed Central
Google ученый
Varoquaux N, Ay F, Noble WS, Vert JP. Статистический подход к выводу трехмерной структуры генома. Биоинформатика. 2014; 30 (12): i26–33.
CAS
PubMed
PubMed Central
Google ученый
Дюран, Северная Каролина, Шамим М.С., Махол I, Рао СС, Хантли М.Х., Лендер Е.С., Эйден Э.Л.Соковыжималка предоставляет систему с одним щелчком мыши для анализа экспериментов высокого разрешения с петлевым разрешением. Cell Syst. 2016; 3 (1): 95–8.
CAS
PubMed
PubMed Central
Google ученый
Servant N, Varoquaux N, Lajoie BR, Viara E, Chen CJ, Vert JP, Heard E, Dekker J, Barillot E. HiC-pro: оптимизированный и гибкий конвейер для обработки данных Hi-C. Genome Biol. 2015; 16 (1): 259.
PubMed
PubMed Central
Google ученый
Ай Ф, Благородный WS. Методы анализа для изучения трехмерной архитектуры генома. Genome Biol. 2015; 16 (1): 183.
PubMed
PubMed Central
Google ученый
Oluwadare O, Zhang Y, Cheng J. Алгоритм максимального правдоподобия для восстановления трехмерных структур хромосом человека из данных о контакте хромосом. BMC Genomics. 2018; 19 (1): 161.
PubMed
PubMed Central
Google ученый
Trieu T, Cheng J. MOGEN: инструмент для реконструкции трехмерных моделей геномов на основе данных захвата конформации хромосом. Биоинформатика. 2015; 32 (9): 1286–92.
PubMed
Google ученый
Oluwadare O, Highsmith M, Cheng J. Обзор методов реконструкции трехмерных структур хромосом и генома на основе данных Hi-C. Биол Процедура Онлайн. 2019. https://doi.org/10.1186/s12575-019-0094-0.
Adhikari B, Trieu T, Cheng J.Chromosome3D: реконструкция трехмерных хромосомных структур из данных о частоте взаимодействия hi-C с использованием дистанционной геометрии, имитирующей отжиг. BMC Genomics. 2016; 17 (1): 886.
PubMed
PubMed Central
Google ученый
Fraser J, Rousseau M, Shenker S, Ferraiuolo MA, Hayashizaki Y, Blanchette M, Dostie J. Конформационные признаки хроматина клеточной дифференциации. Genome Biol. 2009; 10 (4): Р37.
PubMed
PubMed Central
Google ученый
Хуа К., Ма Б. EVR: реконструкция моделей трехмерной структуры бактериальной хромосомы с использованием результирующего алгоритма вектора ошибок. BMC Genomics. 2019; 20: 738. https://doi.org/10.1186/s12864-019-6096-0.
Szalaj P, Michalski PJ, Wróblewski P, Tang Z, Kadlof M, Mazzocco G, Ruan Y, Plewczynski D. 3D-GNOME: интегрированный веб-сервис для структурного моделирования трехмерного генома. Nucleic Acids Res. 2016; 44 (W1): W288–93.
CAS
PubMed
PubMed Central
Google ученый
Рибер Л., Махони С. miniMDS: трехмерный структурный вывод из данных высокого разрешения высокого разрешения. Биоинформатика. 2017; 33 (14): i261–6.
CAS
PubMed
PubMed Central
Google ученый
Zhang Z, Li G, Toh KC, Sung WK. Вывод о пространственной организации хромосом с использованием подхода полуопределенного встраивания и данных Hi-C. В: Ежегодная международная конференция по исследованиям в области вычислительной молекулярной биологии. Берлин, Гейдельберг: Спрингер; 2013.п. 317–32.
Google ученый
Лесне А., Рипосо Дж., Роджер П., Курнак А., Моззиконаччи Дж. Трехмерная реконструкция генома по хромосомным контактам. Нат методы. 2014; 11 (11): 1141.
CAS
PubMed
Google ученый
Ван С., Сюй Дж., Цзэн Дж. Логическое моделирование трехмерной структуры хроматина. Nucleic Acids Res. 2015; 43 (8): e54.
PubMed
PubMed Central
Google ученый
Новотны Дж., Ахмед С., Сюй Л., Олувадаре О., Чен Х., Хенсли Н., Триу Т., Као Р., Ченг Дж. Итеративная реконструкция трехмерных моделей хромосом человека по данным хромосомного контакта. BMC Bioinformatics. 2015; 16 (1): 338.
PubMed
PubMed Central
Google ученый
Zhu G, Deng W., Hu H, Ma R, Zhang S, Yang J, et al. Реконструкция пространственной организации хромосом через разностороннее обучение. Nucleic Acids Res.2018; 46 (8): e50.
PubMed
PubMed Central
Google ученый
Paulsen J, Sekelja M, Oldenburg AR, Barateau A, Briand N, Delbarre E, Shah A, Sørensen AL, Vigouroux C, Buendia B, Collas P. Chrom3D: трехмерное моделирование генома с Hi-C и ядерные контакты ламин-геном. Genome Biol. 2017; 18 (1): 21.
PubMed
PubMed Central
Google ученый
Ху М., Дэн К., Цинь З., Диксон Дж., Селварадж С., Фанг Дж., Рен Б., Лю Дж. Байесовский вывод о пространственной организации хромосом. PLoS Comput Biol. 2013; 9 (1): e1002893.
CAS
PubMed
PubMed Central
Google ученый
Tjong H, Li W, Kalhor R, Dai C, Hao S, Gong K, Zhou Y, Li H, Zhou XJ, Le Gros MA, Larabell CA. Популяционный анализ трехмерной структуры генома выявляет движущие силы в пространственной организации генома.Proc Natl Acad Sci. 2016; 113 (12): E1663–72.
CAS
PubMed
Google ученый
Розенталь М., Брайнер Д., Хаффер Ф., Эванс С., Шривастава А., Неретти Н. Байесовская оценка трехмерной хромосомной структуры на основе одноклеточных данных hi-C. J Comput Biol. 2019; 26 (11): 1191–1202. https://doi.org/10.1089/cmb.2019.0100.
Рао С.С., Хантли М.Х., Дюран NC, Стаменова Е.К., Бочков И.Д., Робинсон Д.Т., Санборн А.Л., Махол I, Омер А.Д., Ландер Е.С., Эйден Э.Л.Трехмерная карта генома человека с разрешением в килобазы раскрывает принципы образования петель хроматина. Клетка. 2014. 159 (7): 1665–80.
CAS
PubMed
PubMed Central
Google ученый
Dixon JR, Selvaraj S, Yue F, Kim A, Li Y, Shen Y, Hu M, Liu JS, Ren B. Топологические домены в геномах млекопитающих, идентифицированные с помощью анализа взаимодействий хроматина. Природа. 2012; 485 (7398): 376.
CAS
PubMed
PubMed Central
Google ученый
GSE35156, нормализованные данные Hi-C. http://chromosome.sdsc.edu/mouse/hi- c / download.html. По состоянию на 10 апреля 2019 г.
ENCODE Project Consortium. Интегрированная энциклопедия элементов ДНК в геноме человека. Природа. 2012; 489 (7414): 57.
Google ученый
Имакаев М., Фуденберг Г., МакКорд Р.П., Наумова Н., Голобородько А., Ладжуа Б.Р., Деккер Дж., Мирный Л.А. Итеративная коррекция данных hi-C выявляет признаки хромосомной организации.Нат методы. 2012; 9 (10): 999.
CAS
PubMed
PubMed Central
Google ученый
Ху М., Дэн К., Селварадж С., Цинь З., Рен Б., Лю Дж. С.. HiCNorm: устранение ошибок в данных Hi-C с помощью регрессии Пуассона. Биоинформатика. 2012. 28 (23): 3131–3.
CAS
PubMed
PubMed Central
Google ученый
Найт П.А., Руис Д. Быстрый алгоритм балансировки матриц.IMA J Numer Anal. 2013. 33 (3): 1029–47.
Google ученый
Курнак А., Мари-Нелли Х., Марбути М., Кошул Р., Моззиконаччи Дж. Нормализация карты хромосомных контактов. BMC Genomics. 2012; 13 (1): 436.
CAS
PubMed
PubMed Central
Google ученый
Яффе Э., Танай А. Вероятностное моделирование карт контактов hi-C устраняет систематические искажения для характеристики глобальной хромосомной архитектуры.Нат Жене. 2011; 43 (11): 1059.
CAS
PubMed
Google ученый
Rego N, Koes D. 3Dmol. Js: молекулярная визуализация с помощью WebGL. Биоинформатика. 2014; 31 (8): 1322–4.
PubMed
PubMed Central
Google ученый
Duchi J, Hazan E, Singer Y. Адаптивные субградиентные методы для онлайн-обучения и стохастической оптимизации. J Mach Learn Res. 2011; 12 (июл): 2121–59.
Google ученый
Брюнгер А.Т., Адамс П.Д., Клор Г.М., ДеЛано В.Л., Грос П., Гроссе-Кунстлеве Р.В., Цзян Д.С., Кушевски Дж., Нильгес М., Панну Н.С., Рид Р.Дж. Система кристаллографии и ЯМР: новый пакет программ для определения структуры макромолекул. Acta Crystallogr D Biol Crystallogr. 1998. 54 (5): 905–21.
PubMed
Google ученый
Turner, D. Spacewalk, (2019), репозиторий GitHub: https: // github.com / igvteam / spacewalk.
Google ученый
27-е ежегодное издание базы данных по исследованию нуклеиновых кислот и сбор базы данных по молекулярной биологии | Исследование нуклеиновых кислот
812″ data-legacy-id=»SEC1″> НОВЫЕ И ОБНОВЛЕННЫЕ БАЗЫ ДАННЫХ
В 2020 году выйдет 27-й ежегодный выпуск базы данных по исследованиям нуклеиновых кислот. Как обычно, 148 статей охватывают весь спектр биологических исследований. В этом году опубликованы статьи о 59 новых базах данных (таблица 1), а в 79 ресурсах представлены статьи с обновленной информацией о последних событиях. Еще 10 статей касаются обновлений баз данных, опубликованных в последнее время в другом месте (Таблица 2). Выпуск начинается с отчетов от основных поставщиков баз данных в U.S. Национальный центр биотехнологической информации (NCBI), Европейский институт биоинформатики (EBI) и Национальный центр данных по геномике (NGDC) в Китае — новое предприятие, включающее ранее опубликованный Центр данных Пекинского института геномики. Дальнейшие статьи сгруппированы теперь уже знакомым образом: (i) последовательность и структура нуклеиновой кислоты, регуляция транскрипции; (ii) последовательность и структура белка; (iii) метаболические и сигнальные пути, ферменты и сети; (iv) геномика вирусов, бактерий, простейших и грибов; (v) геномика человека и модельных организмов плюс сравнительная геномика; (vi) геномные вариации человека, болезни и лекарства; (vii) растения и (viii) другие темы, такие как базы данных протеомики.Как всегда, дисциплинарный характер многих современных ресурсов означает, что читателей поощряют просматривать весь выпуск. Онлайновая коллекция баз данных молекулярной биологии Nucleic Acids Research, более точно классифицирующая базы данных с использованием 15 категорий и 41 подкатегории, может быть найдена по адресу http://www.oxfordjournals.org/nar/database/c/.
Таблица 1.
Описание новых баз данных в выпуске NAR Database 2020 года
Таблица 1.
Описание новых баз данных в выпуске NAR Database 2020 года
Таблица 2.
Обновленные описания баз данных, недавно опубликованные в другом месте
Таблица 2.
Обновленные описания баз данных, недавно опубликованные в другом месте
Среди крупных глобальных центров NCBI (1) сообщает об обновлениях во многих базах данных и интерфейсах. Например, поиск генов теперь может искусно извлекать ортологи от (подмножеств) позвоночных. Документ EBI (2) включает поразительные цифры, которые иллюстрируют глубокую взаимосвязанность размещенных на нем баз данных, а также их бесчисленные ссылки на внешние ресурсы.В нем также описывается важное нововведение — архив биографических изображений. В документе Национального центра данных по геномике (3) содержится описание их быстро расширяющегося набора баз данных, некоторые из которых подробно описаны в других разделах этого выпуска. Они сообщают, что их база данных для считывания необработанных последовательностей, Архив геномных последовательностей, теперь занимает более петабайта.
В разделе «Базы данных нуклеиновых кислот» основные возвращаемые базы данных включают miRTarBase (4), базу данных экспериментально подтвержденных взаимодействий miRNA-мишень, предлагая новый фокус на регуляторных сетях miRNA; и miRDB (5), база данных предсказанных сайтов-мишеней miRNA, здесь сообщается об улучшенном алгоритме предсказания и предсказании функции miRNA на основе генной онтологии.MirGeneDB (6), впервые представленный в Nucleic Acids Research, использует эволюционный подход для ручного курирования и классификации miRNA и охватывает 45 репрезентативных метазоа. В другом месте LncBase индексирует мишени миРНК, обнаруженные в транскриптах нкРНК, включая рассмотрение вариантов последовательностей, лежащих в сайтах связывания миРНК (7). Две возвращающиеся базы данных охватывают взаимодействия РНК с другими биомолекулами в более широком смысле. NPInter (8) охватывает взаимодействия нкРНК и впервые включает партнеров ДНК и circRNA, в то время как RNAInter (9), преемник ранее опубликованного RAID (10), теперь содержит в 8 раз больше данных о взаимодействиях, чем раньше, и охватывает заметно широкий диапазон РНК и взаимодействующих молекул.Хорошо известная база данных сайтов связывания факторов транскрипции JASPAR (11) предоставляет обновленный документ, который, что интересно, сообщает о наборе непроверенных сайтов и механизмах, с помощью которых сообщество пользователей может помочь в их курировании. TFBSshape (12) — еще одна возвращающаяся база данных сайтов связывания факторов транскрипции, но основное внимание уделяется трехмерной форме ДНК, которая может значительно изменяться при метилировании ДНК, как важном элементе специфичности связывания. Данные по экспрессии генов представлены в хорошо известном Атласе экспрессии (13), в котором представлен новый раздел для экспрессии генов отдельных клеток, а также в новичке KnockTF (14), в котором сообщается о влиянии на экспрессию экспериментов с нокаутом или нокдауном фактора транскрипции.Другая новая база данных SpatialDB (15) предоставляет данные транскриптома с пространственным разрешением по 10 экспериментальным методам и пяти видам. С появлением snoDB (16) молекулы snoRNA человека — играющие важную роль в управлении посттранскрипционными модификациями РНК, но все чаще подозреваемые в ряде других функций — получают новую специализированную базу данных. Наконец, две новые базы данных посвящены альтернативному полиаденилированию в клетках человека. APAatlas (17) изучает тканевую специфичность процесса, в то время как SNP2APA (18) рассматривает, как влияние SNP на альтернативное полиаденилирование связано с раком.
Две статьи журнала «Прорыв» можно найти в разделе, посвященном базам данных о последовательностях и структурах белков. База данных ABCD (AntiBodies Chemically Defined) (19) хранит информацию об антителах и их антигенах, ссылаясь на стандартные базы данных каждой из них. Одним из основных факторов создания базы данных была экспериментальная воспроизводимость, поскольку, как отмечают авторы, серьезной проблемой являются плохо определенные или изменяемые партии антитела (20). Таким образом, ABCD присваивает уникальный идентификатор каждой последовательности антитела (представленной цепями V L и V H ) с известным антигеном.Стремясь к устойчивости этой тщательно подобранной базы данных и признавая трудоемкость поиска литературы, авторы поощряют отправку записей непосредственно коллегами в этой области. Другая ценная новая база данных, относящаяся к антителам, Thera-SAbDab (21) связывает терапевтические последовательности антител или нанотел, признанные Всемирной организацией здравоохранения, с записями в базе данных структурных антител авторов SAbDab (22) для аналогичных или идентичных белков.
Вторая революционная статья сообщает о возвращении ресурса SCOP (структурная классификация белков) через несколько лет (23).Новая итерация базы данных использует упрощенную версию схемы, опубликованную в виде прототипа в 2013 г. (24). В то время первоначальные авторы отошли от своей первоначальной концепции чисто иерархической базы данных, хотя их первоначальная структура с тех пор постоянно и очень ценно поддерживается командой SCOPe (25). SCOPe продолжает широко использоваться, но сообщество структурной биоинформатики будет проявлять большой интерес к новым, более гибким отношениям, разрешенным SCOP в 2020 году.Новая версия также включает определения внутренне неструктурированных участков белка. Эти и традиционные складчатые домены теперь разделены на четыре типа белков: растворимый, мембранный, волокнистый и внутренне неупорядоченный. Хотя база данных остается в значительной степени иерархической, авторы иллюстрируют неиерархические отношения, которые теперь эффективно фиксируются новой схемой. Другой фундаментальный ресурс в биоинформатике белков, База данных консервативных доменов (26), сообщает об обновлении собственной структуры аннотаций иерархических семейств последовательностей белков.В другом месте главной новостью является появление не менее четырех баз данных, посвященных белкам, участвующим в разделении жидкой и жидкой фаз (27–30). Эти белки составляют основу безмембранных органелл / конденсатов (31), которые обнаруживаются в различных клеточных компартментах и дисфункция которых все больше связана с заболеванием (32). Более известные классы белков описаны в возвращающемся DisProt (33) для нарушений, присущих белкам, и в WALTZ-DB (34) для амилоидогенных белковых последовательностей. В другом месте регулярное обновление PDBe (35) сообщает об улучшенных методах поиска, расширенных ссылках на другие базы данных, например, о молекулах РНК, и улучшенной идентификации кофакторов.Новая ассоциированная база данных PDBe-KB (36) предлагает аннотации депозитов PDB из впечатляющего массива из 18 партнерских ресурсов, многие из которых знакомы читателям NAR Database and Webserver Issues. Страницы PDBe-KB с особенно стильным и интуитивно понятным представлением предлагают эффективный способ просмотра функциональных характеристик интересующей белковой структуры.
Ряд основных баз данных путей вносит обновленные статьи в раздел метаболизма и передачи сигналов. Они включают Pathway Commons (37), которая объединяет данные из большого количества баз данных путей и взаимодействий.Разработчики сообщают, однако, что немногие из них в настоящее время финансируются, и поэтому, чтобы обратиться к быстро растущей литературе, планируется инструмент поддержки курирования, который позволит авторам подавать резюме своих новых статей для курирования. Reactome сообщает о своем собственном обновлении (38), в котором также сообщается об усилиях по привлечению сообщества к участию в ресурсе, и включает новый поразительный браузер диаграмм Вороного для визуализации путей. Важным нововведением в этой области является PathBank (39), цель которого — всесторонняя каталогизация метаболических и сигнальных путей в модельных организмах.Он также стремится к участию сообщества и специализируется на охвате путей и вариантах поиска, визуализации и загрузки данных. Метаболические и сигнальные модели находятся в центре внимания двух возвращающихся баз данных. BIGG Models (40) продолжает расширять свое содержание метаболических моделей в масштабе генома, включая впервые модели с несколькими штаммами, и теперь ссылается на инструмент проверки модели. В обновленной статье BioModels (41) сообщается о содержании около 2000 моделей. Они подлежат целевому контролю, и авторы показывают, что пользователи решительно предпочитают тщательно отобранные модели, чем необработанные.В планы на будущее входит принятие представленных на компьютере моделей и обеспечение возможности хранения и распространения многомасштабных моделей. Сигнализация находится в центре внимания двух баз данных: MiST (42) возвращается после десятилетнего отсутствия с новым интерфейсом к каталогизации микробных сигнальных систем, белков и доменов, а SIGNOR (43) сообщает о почти удвоении размера графических представлений информации. поток в эукариотических клетках, особенно у человека. Широко используемая база данных MiBiG (44) кластеров биосинтетических генов поступает в Nucleic Acids Research, сообщая о недавнем расширении за счет как вклада сообщества, так и внутренних усилий, а также с улучшенными ссылками на базы данных малых молекул.В той же области IMG / ABC (45) возвращается с версией 5.0, используя недавние улучшения в конвейере анализа генома antiSMASH (46) и предлагая данные более высокого качества, охватывающие большее количество типов кластеров. Наконец, MetaboLights (47) сообщает об обновлении через семь лет, которое показывает быстро растущее количество заявок. В документе особое внимание уделяется удобству использования, сообщается не только об улучшениях в конвейере подачи заявок, но и о редизайне веб-сайта, вызванном юзабилити-тестированием.
Раздел микробной геномики содержит пару возвращающихся ресурсов, посвященных устойчивости к противомикробным препаратам.Очень популярная база данных CARD (48) сообщает о проблемах, связанных с обработкой 5000 документов в год в области устойчивости к противомикробным препаратам, и, среди других нововведений, теперь включает рассчитанные с помощью вычислений данные резистома. Обновление MEGARes (49) показывает, как включение детерминант устойчивости к металлам и биоцидам способствует почти двукратному увеличению размера. Также описан улучшенный конвейер для вычислительной аннотации резистома метагеномных образцов. Новая база данных PADS Arsenal (50) охватывает системы противовирусной защиты прокариот 18 различных типов для более чем 30 000 прокариот.Предлагается впечатляющее разнообразие визуализаций и аналитических инструментов. CRISPRCasdb (51) — это новая база данных, которая включает в себя как массивы CRISP, так и белки Cas и присваивает системе тип и подтип. Два общих ресурса по сравнительной геномике публикуют статьи в Update. MicroScope (52) сообщает о ряде новых инструментов для аннотирования генов и областей генома, направленных на прогнозирование таких свойств, как функция, существенность, вирулентность и устойчивость к антибиотикам. В документе PATRIC Bioinformatics Resource Center (53) сообщается, что теперь охвачено 250 000 геномов.В соответствии с их ориентацией на патогены, устойчивость к противомикробным препаратам является основной темой, но они также сообщают о новых инструментах анализа и визуализации. Взаимодействие патоген-хозяин рассматривается как PHI-Base (54), которая сообщает о большом расширении и увеличении использования аннотаций других баз данных; и значительная новинка BacFITBase (55), которая применяет стандартизированную обработку опубликованных данных, чтобы дать возможность оценить, насколько важны гены 15 патогенных бактерий для инфицирования пяти позвоночных-хозяев.Основная платформа метагеномики MGnify (55) (ранее EBI Metagenomics) имеет обновление, в котором описаны улучшения в ее конвейере сборки и анализа, введение новой системы уникальных и стабильных номеров доступа и легкая доступность быстро расширяющейся белковой последовательности MGnify. база данных, которая не является избыточной с помощью UniProtKB.
В следующем разделе снова широко представлены базы данных модельных организмов (МО). В третьей статье журнала описывается новый Альянс геномных ресурсов (56).Альянс — это важная стратегическая попытка собрать воедино плоды всего опыта отдельных аннотаторов, задействованных в ресурсах MO. На своем портале пользователь может искать ген из любимой МО и получать информацию об экспрессии, фенотипе и ортологии от всех участвующих МО. Ленточные изображения показывают, например, онтологию генов и ассоциации заболеваний между ортологичными генами. Одна особенно умная особенность — автоматическое описание гена, которое создает удобочитаемое резюме, оптимально резюмирующее термины онтологии, относящиеся к гену, в тексте заданной длины.Разумно, авторы Альянса стремятся обмениваться моделями данных и вычислительными конвейерами между ресурсами, чтобы облегчить будущую устойчивую интеграцию текущих и будущих партнеров по базам данных. Альянс находится на той же территории, что и предыдущий получатель бумаги «Прорыв», «Инициатива монархов» для связывания генов, вариантов, генотипов, фенотипов и болезней разных видов. Здесь сообщается (57) о большем количестве охваченных видов, большем количестве источников данных, новой онтологии болезней и новом веб-сайте. Одна особенно изящная новая функция — это виджет текстовой аннотации, который помечает фрагмент текста, такой как бумажный реферат, со ссылками на онтологии, которые можно исследовать в дальнейшем.Среди участников Альянса, вносящих обновления, — База данных генома крысы (58), которая достойно отмечает свое 20-летие в Год Крысы, База данных генома Saccharomyces (59) и База данных червей (60). Вернувшись после десятилетнего отсутствия, SilkDB сообщает 3.0 (61) с более качественной сборкой генома, данными пангенома для сравнения вариантов генома, данными транскриптомики на уровне тканей и впечатляюще широким диапазоном представлений данных. Краеугольный проект Ensembl предлагает свое обычное обновление (62), описывающее очень значительные улучшения, включая 94 новых генома позвоночных, новые инструменты для аннотирования и визуализации вариантов и лучшие ресурсы для эпигеномных данных.К нему присоединяется сопутствующая база данных Ensembl Genomes (63) по геномике беспозвоночных. Этот последний документ раскрывает новость о том, что оба они будут доступны с одного веб-сайта в течение 2020 года как отражение большей интеграции двух проектов, которая считается необходимой для оптимальной обработки и отображения результатов проектов мегамасштабного секвенирования, таких как Earth BioGenome Project ( 64). В другом месте Ohnologs сообщает о выпуске v2 (65). Дупликация всего генома сыграла значительную роль, особенно в эволюции позвоночных, и база данных Ohnologs сосредоточена на тех генах, которые сохраняются после дупликации.
Большое количество баз данных по геномным вариациям человека, болезням и лекарствам включает в себя несколько вернувшихся основных игроков. Важная новость из Руководства по фармакологии IUPHAR / BPS (66) — это новое расширение, Руководство IUPHAR / MMV по фармакологии малярии, совместная инициатива с Medicines for Malaria Venture и доступная через собственный URL-адрес (www.guidetomalariapharmacology.org) . В широко используемой базе данных IPD-IMGT / HLA (67) сообщается о продолжающемся сильном росте содержания названных аллелей HLA, в то время как обновление популярной базы данных Allele Frequency Net (68), охватывающей полиморфизмы нескольких связанных с иммунитетом генов, описывает новая категоризация данных HLA по категориям качества «золото», «серебро» и «бронза», выявляющая некоторые глобальные различия в выборке.Важным нововведением в области иммуноинформатики является VDJbase (69), разработанная специально для хранения данных генотипа и гаплотипа для результатов секвенирования репертуара адаптивного иммунного рецептора (AIRR-seq). Исследователям предлагается представить свои собственные наборы данных, которые будут проверены, обработаны и помещены в базу данных. Возвращаемая база данных VDJdb (70) фокусируется на последовательностях рецепторов Т-клеток и их родственных антигенах. В нем сообщается об огромном недавнем росте и об интерфейсе для помощи в анализе больших наборов данных, например, полученных из AIRR-seq.Еще одним важным нововведением в этой области является OGRDB (71) — база данных последовательностей зародышевой линии иммунных рецепторов, цель которой — предоставить эталонные наборы генов зародышевой линии для правильной интерпретации данных AIRR-seq. Несколько баз данных, которые являются новыми или представлены здесь впервые, исследуют данные Общегеномного исследования ассоциации и их способность точно определять геномную изменчивость, лежащую в основе признаков и заболеваний. В документе GWAS Central (72) описывается, как он охватывает почти 4000 исследований на людях, и планируется сопоставить данные человека и мыши, поскольку мышь может использоваться для проверки результатов GWAS человека.Новый Атлас GWAS (73), напротив, сосредоточен на растениях и домашних животных. Другой новый ресурс CausalDB (74) фокусируется на применении инструментов точного картирования, чтобы попытаться отсеять истинные причинные варианты из данных GWAS, в то время как TSEA-DB (75) предлагает интересный тканеспецифичный взгляд на черты и фенотипы GWAS. Все усилия по увязке вариации генома с фенотипом выигрывают от полного и сбалансированного представления разнообразия видов, поэтому появление базы данных PGG .Han (76) приветствуется, поскольку в ней основное внимание уделяется китайцам хань, группе которых до сих пор недостаточно. в данных популяционной геномики.Среди ресурсов для разработки лекарств стоит выделить популярную базу данных терапевтических мишеней (77), в которой сообщается о ряде новых функций, включая регуляторы мишеней (как miRNA, так и TF), белки, взаимодействующие с мишенями, и информационные мишени запатентованных терапевтических агентов. TDR Targets (78) фокусируется, в частности, на разработке лекарств для лечения забытых тропических болезней и включает новые данные в сетевое представление, что позволяет, например, приоритизировать целевые объекты целого генома и изучить возможность перепрофилирования лекарств.Он также представляет собой стильную обложку этого выпуска. Две другие широко используемые базы данных, ClinVar (79) и DisGeNET (80), также вносят обновления, каждая из которых содержит расширенный контент и новый веб-интерфейс. Как всегда, онкологические базы данных хорошо представлены с новыми вкладами в эту область, включая CancerTracer (81), ресурс для изучения и внутрибольничной гетерогенности опухолей, который содержит данные от 1500 пациентов, включая специфические для пациента филогенетические деревья опухолей, и DNMIVD (82), который выполняет широкий спектр функций, касающихся связей между метилированием ДНК и раком.
Крупной базой данных о возвращающихся растениях является PlantRegMap (83), которая использует информацию из связанной с ней базы данных сайтов связывания растительных факторов транскрипции PlantTFDB, чтобы помочь предсказать функциональные регуляторные карты десятков растений. В единственной статье (84) сообщается об обновлениях баз данных каталогов AraPheno и AraGWAS, которые включают данные о РНК-Seq и нокаут-мутациях для модельного организма Arabidopsis thaliana . Мальвовые, в состав которых входят такие важные культуры, как хлопок и какао, получают собственную специализированную базу данных функциональной геномики MaGenDB (85), которая включает более 300 различных наборов данных omics и настраиваемый браузер генома.MBKbase (86), база знаний по молекулярной селекции растений, также очень ориентирована на сельскохозяйственные цели. Он включает информацию о зародышевой плазме, а также данные геномного, популяционного секвенирования, фенотипа и экспрессии генов.
Последний раздел с базами данных, которые нелегко попадают в предыдущие категории, содержит обычную интригующую и эклектичную смесь. Исследования протеомики охватываются двумя основными возвращающимися базами данных. ProteomeXchange (87) охватывает изменения, внесенные в каждую из входящих в него организаций, теперь — с добавлением iProX и Panorama Public — всего шесть.ProteomicsDB (88) — который также включает в себя различные данные, такие как экспрессия генов и, в новом выпуске, информация об обмене белков — теперь поддерживает организмы, отличные от исходного человека, причем A. thaliana лидирует. Популярная база данных MatrisomeDB (89), охватывающая протеомику внеклеточного матрикса, появляется здесь впервые с новой версией, которая утроила количество наборов данных по сравнению с оригиналом. В другом месте FoldamerDB (90) обращается к пептидным фолдамеру, неприродным олигомерам с определенной структурой раствора, которые имитируют поведение природных макромолекул и имеют потенциал в таких разнообразных областях, как антимикробная терапия и материаловедение.Наконец, база данных Genus (91) содержит расчеты, относящиеся к роду, топологическому свойству всех молекул белка и РНК в PDB, что также позволяет анализировать структуры, загруженные пользователями.
829″ data-legacy-id=»ACK1″> БЛАГОДАРНОСТИ
Мы особенно благодарим доктора Мартин Бернардес-Силва и остальных сотрудников Oxford University Press во главе с Джоанной Вентикос за их помощь в составлении этого выпуска.
834″ data-legacy-id=»REF1″> ССЫЛКИ
1.
Sayers
EW
,
Beck
J.
,
Brister
JR
,
Bolton
EE
,
Canese
K.
, Fun
DC
000
K.
,
Ketter
A.
,
Kim
S.
,
Kimchi
A.
et al. .
Ресурсы базы данных Национального центра биотехнологической информации
.
Nucleic Acids Res.
2019
; .2.
Cook
CE
,
Stroe
O.
,
Cochrane
G.
,
Birney
E.
,
Apweiler
R.
глобальная инфраструктура взаимосвязанных ресурсов данных для наук о жизни
.
Nucleic Acids Res.
2019
; .3.
Члены и партнеры Национального центра данных по геномике
Ресурсы базы данных Национального центра данных по геномике в 2020 г.
.
Nucleic Acids Res.
2019
; .4.
Хуан
H.-Y.
,
Лин
Y.-C.-D.
,
Li
J.
,
Huang
K.-Y.
,
Shrestha
S.
,
Hong
H.-C.
,
Tang
Y.
,
Chen
Y.-G.
,
Jin
C.-N.
,
Yu
Y.
et al. .
miRTarBase 2020: обновления экспериментально подтвержденной базы данных взаимодействий микроРНК и мишени
.
Nucleic Acids Res.
2019
; .5.
Chen
Y.
,
Wang
X.
miRDB: онлайн-база данных для прогнозирования функциональных целей микроРНК
.
Nucleic Acids Res.
2019
; .6.
Fromm
B.
,
Domanska
D.
,
Høye
E.
,
Ovchinnikov
V.
,
Kang
W.
—
Aparicio
,
Johansen
M.
,
Flatmark
K.
,
Mathelier
A.
,
Hovig
E.
et al. .
MirGeneDB 2.0: комплемент микроРНК многократных животных
.
Nucleic Acids Res.
2019
; .7.
Karagkouni
D.
,
Paraskevopoulou
M.D.
,
Tastsoglou
S.
,
Skoufos
G.
,
Karavangeli
A.
,
Pierros
V.
,
Zacharopoulou
E.
,
Hatzigeorgiou
A.G.
DIANA-LncBase v3: экспериментально поддерживаемая индексация мишеней miRNA на некодирующих транскриптах
.
Nucleic Acids Res.
2019
; .8.
Teng
X.
,
Chen
X.
,
Xue
H.
,
Tang
Y.
,
Zhang
P.
,
Kang
Q.
,
Hao
Y.
,
Chen
R.
,
Zhao
Y.
,
He
S. база данных взаимодействий нкРНК
.
Nucleic Acids Res.
2019
; .9.
Lin
Y.
,
Liu
T.
,
Cui
T.
,
Wang
Z.
,
Zhang
Y.
,
Tan
P.
,
Huang
Y.
,
Yu
J.
,
Wang
D.
RNAInter в 2020: репозиторий взаимодействий РНК с увеличенным охватом и аннотацией
.
Nucleic Acids Res.
2019
; .10.
Yi
Y.
,
Zhao
Y.
,
Li
C.
,
Zhang
L.
,
Huang
H.
,
Li
Y.
,
Liu
L.
,
Hou
P.
,
Cui
T.
,
Tan
P.
и др. .
RAID v2.0: обновленный ресурс связанных с РНК взаимодействий между организмами
.
Nucleic Acids Res.
2017
;
45
:
D115
—
D118
.11.
Форнес
О.
,
Кастро-Мондрагон
Дж.A.
,
Khan
A.
,
van der Lee
R.
,
Zhang
X.
,
Richmond
P.A.
,
Modi
B.P.
,
Correard
S.
,
Gheorghe
M.
,
Baranašić
D.
et al. .
JASPAR 2020: обновление базы данных открытого доступа профилей связывания факторов транскрипции
.
Nucleic Acids Res.
2019
; .12.
Chiu
T.-P.
,
Xin
B.
,
Markarian
N.
,
Wang
Y.
,
Rohs
R.
TFBSshape: расширенная база данных мотивов для особенностей формы ДНК сайтов связывания факторов транскрипции
.
Nucleic Acids Res.
2019
; .13.
Papatheodorou
I.
,
Moreno
P.
,
Manning
J.
,
Fuentes
A.M.-P.
,
George
N.
,
Fexova
S.
,
Fonseca
NA
,
Füllgrabe
A.
,
Green
M.
,
et al
et al
. .
Обновление Атласа экспрессии: от тканей к отдельным клеткам
.
Nucleic Acids Res.
2019
; .14.
Feng
C.
,
Song
C.
,
Лю
Я.
,
Цянь
Ф.
,
Гао
Я.
,
Нин
З.
,
Ван
Кв.
,
000 Цзян
Li
Y.
,
Li
M.
et al. .
KnockTF: комплексная база данных профилей экспрессии генов человека с отключением / отключением факторов транскрипции
.
Nucleic Acids Res.
2019
; .15.
Fan
Z.
,
Chen
R.
,
Chen
X.
SpatialDB: база данных для пространственно разрешенных транскриптомов
.
Nucleic Acids Res.
2019
; .16.
Bouchard-Bourelle
P.
,
Desjardins-Henri
C.
,
Mathurin-St-Pierre
D.
,
Deschamps-Francoeur
G.
,
Couture Fafard .
,
Гарант
Ж.-М.
,
Elela
S.A.
,
Scott
M.S.
snoDB: интерактивная база данных последовательностей snoRNA человека, численности и взаимодействий
.
Nucleic Acids Res.
2019
; .17.
Hong
W.
,
Ruan
H.
,
Zhang
Z.
,
Ye
Y.
,
Liu
Y.
,
Li
S.
,
Jing
Y.
,
Zhang
H.
,
Diao
L.
,
Liang
H.
et al. .
APAatlas: расшифровка альтернативного полиаденилирования в тканях человека
.
Nucleic Acids Res.
2019
; .18.
Ян
Я.
,
Чжан
Кв.
,
Мяо
Ю.-Р.
,
Ян
Дж.
,
Ян
W.
,
Yu
F.
,
Wang
D.
,
Guo
A.-Y.
,
Gong
J.
SNP2APA: база данных для оценки эффектов генетических вариантов на альтернативное полиаденилирование при раке человека
.
Nucleic Acids Res.
2019
; .19.
Лима
W.C.
,
Gasteiger
E.
,
Marcatili
P.
,
Duek
P.
,
Bairoch
A.
,
Cosson
P.
База данных ABCD: хранилище химически определенных антител
.
Nucleic Acids Res.
2019
; .20.
Baker
M.
Кризис воспроизводимости: все виноваты антитела
.
Природа
.
2015
;
521
:
274
—
276
. 21.
Raybould
M.I.J.
,
Марки
C.
,
Lewis
A.P.
,
Shi
J.
,
Bujotzek
A.
,
Taddese
B.
,
Deane
C.M.
Thera-SAbDab: база данных терапевтических структурных антител
.
Nucleic Acids Res.
2019
; .22.
Dunbar
J.
,
Krawczyk
K.
,
Leem
J.
,
Baker
T.
,
Fuchs
A.
,
Georges
G.
,
Shi
J.
,
Deane
C.M.
SAbDab: база данных структурных антител
.
Nucleic Acids Res.
2014
;
42
:
D1140
—
D1146
. 23.
Андреева
А.
,
Кулеша
Е.
,
Гоф
Дж.
,
Мурзин
А.G.
База данных SCOP в 2020 году: расширенная классификация доменов репрезентативных семейств и суперсемейств известных белковых структур
.
Nucleic Acids Res.
2019
; .24.
Андреева
A.
,
Howorth
D.
,
Chothia
C.
,
Kulesha
E.
,
Murzin
AG
Прототип структуры белка SCOP2 добыча
.
Nucleic Acids Res.
2014
;
42
:
D310
—
D314
. 25.
Fox
N.K.
,
Бреннер
S.E.
,
Chandonia
J.-M.
SCOPe: Структурная классификация белков — расширенная, интеграция данных SCOP и ASTRAL и классификация новых структур
.
Nucleic Acids Res.
2014
;
42
:
D304
—
D309
.26.
Lu
S.
,
Wang
J.
,
Chitsaz
F.
,
Derbyshire
M.K.
,
Geer
R.C.
,
Gonzales
N.R.
,
Gwadz
M.
,
Hurwitz
D.I.
,
Марчлер
G.H.
,
Песня
J.S.
et al. .
CDD / SPARCLE: база данных сохраненных доменов в 2020 году
.
Nucleic Acids Res.
2019
; .27.
Ning
W.
,
Guo
Y.
,
Lin
S.
,
Mei
B.
,
Wu
Y.
,
Jiang
P. Tan
X.
,
Zhang
W.
,
Chen
G.
,
Peng
D.
et al. .
DrLLPS: информационный ресурс разделения жидкой и жидкой фаз у эукариот
.
Nucleic Acids Res.
2019
; .28.
Li
Q.
,
Peng
X.
,
Li
Y.
,
Tang
W.
,
Zhu
J.
,
Huang
J. Qi
Y.
,
Zhang
Z.
LLPSDB: база данных белков, подвергающихся разделению жидкой фазы in vitro
.
Nucleic Acids Res.
2019
; .29.
You
K.
,
Huang
Q.
,
Yu
C.
,
Shen
B.
,
Sevilla
C.
,
Shi
M. 9000 Hermjakob
H.
,
Chen
Y.
,
Li
T.
PhaSepDB: база данных белков, связанных с разделением жидкой и жидкой фаз
.
Nucleic Acids Res.
2019
; .30.
Mészáros
B.
,
Erdős
G.
,
Szabó
B.
,
Schád
É.
,
Тантос
Б.
,
Abukhairan
R.
,
Horváth
T.
,
Murvai
N.
,
Kovács
O.P.
,
Kovács
M.
et al. .
PhaSePro: база данных белков, управляющих разделением жидкой и жидкой фаз
.
Nucleic Acids Res.
2019
; .31.
Feng
Z.
,
Chen
X.
,
Wu
X.
,
Zhang
M.
Образование биологических конденсатов посредством разделения фаз: характеристики, аналитические методы и физиологические последствия
.
J. Biol. Chem.
2019
;
294
:
14823
—
14835
. 32.
Альберти
S
,
Дорман
D.
Разделение жидкой и жидкой фаз при болезни
.
Annu. Преподобный Жене.
2019
;
53
: 0,33.
Hatos
A.
,
Hajdu-Soltész
B.
,
Monzon
A.M.
,
Palopoli
N.
,
Álvarez
L.
,
Aykac-Fas
B.
,
Bassot
C.
,
Benítez
G.I.
,
Бевилаква
М.
,
Chasapi
A.
et al. .
DisProt: аннотация нарушения внутреннего белка в 2020 г.
.
Nucleic Acids Res.
2019
; .34.
Louros
N.
,
Konstantoulea
K.
,
De Vleeschouwer
M.
,
Ramakers
M.
,
Schymkowitz
J.
,
WALTZ-DB 2.0: обновленная база данных, содержащая структурную информацию экспериментально определенных амилоид-образующих пептидов
.
Nucleic Acids Res.
2019
; .35.
Армстронг
D.R.
,
Berrisford
J.M.
,
Conroy
M.J.
,
Gutmanas
A.
,
Anyango
S.
,
Choudhary
P.
P.
A., 9. 9.
,
Dana
J.M.
,
Deshpande
M.
,
Dunlop
R.
et al. .
PDBe: улучшена возможность поиска данных о структуре макромолекул в PDB
.
Nucleic Acids Res.
2019
; .36.
Консорциум PDBe-KB
PDBe-KB: управляемый сообществом ресурс для структурных и функциональных аннотаций
.
Nucleic Acids Res.
2019
; .37.
Родченков
И.
,
Бабур
О.
,
Луна
А.
,
Аксой
Б.А.
,
Wong
J.V.
,
Fong
D.
,
Franz
M.
,
Siper
M.C.
,
Cheung
M.
,
Wrana
M.
et al. .
Обновление Pathway Commons 2019: интеграция, анализ и изучение данных о путях
.
Nucleic Acids Res.
2019
; .38.
Jassal
B.
,
Matthews
L.
,
Viteri
G.
,
Gong
C.
,
Lorente
P.
,
Fabregat 9
,
Сидиропулос
K.
,
Cook
J.
,
Gillespie
M.
,
Haw
R.
et al. .
База знаний о путях реакции
.
Nucleic Acids Res.
2019
; .39.
Wishart
D.S.
,
Li
C.
,
Marcu
A.
,
Badran
H.
,
Pon
A.
,
Budinski
,
Patron
J.
,
Lipton
D.
,
Cao
X.
,
Oler
E.
et al. .
PathBank: обширная база данных о путях для модельных организмов
.
Nucleic Acids Res.
2019
; .40.
Norsigian
C.J.
,
Pusarla
N.
,
McConn
J.L.
,
Yurkovich
J.T.
,
Dräger
A.
,
Palsson
B.O.
,
King
Z.
BiGG Models 2020: мультиштаммовые модели в масштабе генома и распространение по филогенетическому дереву
.
Nucleic Acids Res.
2019
; .41.
Малик-Шериф
Р.С.
,
Glont
M.
,
Nguyen
T.V.N.
,
Tiwari
K.
,
Roberts
M.G.
,
Ксавье
А.
,
Ву
M.T.
,
Men
J.
,
Maire
M.
,
Kananathan
S.
et al. .
Биомодели — 15 лет совместного использования вычислительных моделей в науках о жизни
.
Nucleic Acids Res.
2019
; .42.
Гумеров
В.М.
,
Ортега
D.R.
,
Adebali
O.
,
Ulrich
L.E.
,
Жулин
И.B.
MiST 3.0: обновленная база данных по трансдукции микробных сигналов с акцентом на хемосенсорные системы
.
Nucleic Acids Res.
2019
; .43.
Licata
L.
,
Surdo
P.L.
,
Iannuccelli
M.
,
Palma
A.
,
Micarelli
E.
,
Perfetto
L.
,
Peluso
D.
der A.
,
Castagnoli
L.
,
Cesareni
G.
SIGNOR 2.0, SIGnaling Network Open Resource 2.0: обновление 2019
.
Nucleic Acids Res.
2019
; .44.
Kautsar
S.A.
,
Blin
K.
,
Shaw
S.
,
Navarro-Muñoz
J.C.
,
Terlouw
B.R.
,
van der Hooft
J.J.J.
,
ван Сантен
J.A.
,
Tracanna
V.
,
Suarez Duran
H.G.
,
Andreu
V.P.
et al. .
MIBiG 2.0: хранилище кластеров биосинтетических генов с известной функцией
.
Nucleic Acids Res.
2019
; .45.
Palaniappan
K.
,
Chen
I.-M.A.
,
Чу
К.
,
Ратнер
А.
,
Сешадри
р.
,
Кирпид
Н.С.
,
Иванова
Н.Н.
,
Mouncey
N.J.
MG-ABC v.5.0: обновление базы знаний IMG / Атласа кластеров биосинтетических генов
.
Nucleic Acids Res.
2019
; .46.
Blin
K.
,
Shaw
S.
,
Steinke
K.
,
Villebro
R.
,
Ziemert
N.
,
Lee
Y.
,
Weber
T.
antiSMASH 5.0: обновления конвейера извлечения генома вторичных метаболитов
.
Nucleic Acids Res.
2019
;
47
:
W81
—
W87
. 47.
Haug
K.
,
Cochrane
K.
,
Nainala
V.C.
,
Williams
M.
,
Chang
J.
,
Jayaseelan
K.V.
,
О’Донован
C.
MetaboLights: ресурс, развивающийся в ответ на потребности научного сообщества
.
Nucleic Acids Res.
2019
; .48.
Алкок
Б.П.
,
Raphenya
A.R.
,
Лау
T.T.Y.
,
Цанг
К.К.
,
Bouchard
M.
,
Edalatmand
A.
,
Huynh
W.
,
Нгуен
A.-L.V.
,
Cheng
A.A.
,
Лю
S.
et al. .
CARD 2020: надзор за устойчивостью к антибиотикам с помощью обширной базы данных по устойчивости к антибиотикам
.
Nucleic Acids Res.
2019
; .49.
Doster
E.
,
Lakin
S.M.
,
Дин
К.Дж.
,
Вулф
К.
,
Янг
Дж.G.
,
Boucher
C.
,
Belk
K.E.
,
Нойес
N.R.
,
Морли
P.S.
MEGARes 2.0: база данных для классификации детерминант устойчивости к противомикробным препаратам, биоцидам и металлам в данных метагеномной последовательности
.
Nucleic Acids Res.
2019
; .50.
Zhang
Y.
,
Zhang
Z.
,
Zhang
H.
,
Zhao
Y.
,
Zhang
Z.
,
Xiao
J.
PADS Arsenal: база данных генов, связанных с системами прокариотической защиты
.
Nucleic Acids Res.
2019
; .51.
Pourcel
C.
,
Touchon
M.
,
Villeriot
N.
,
Vernadet
J.-P.
,
Couvin
D.
,
Toffano-Nioche
C.
,
Vergnaud
G.
CRISPRCasdb — преемник CRISPRdb, содержащий массивы CRISPR и гены cas из полных последовательностей генома, а также инструменты для загрузки и запроса списков повторов и спейсеров
.
Nucleic Acids Res.
2019
; .52.
Vallenet
D.
,
Calteau
A.
,
Dubois
M.
,
Amours
P.
,
Bazin
A.
,
Beuvin
M.
,
Burlot
L.
,
Bussell
X.
,
Fouteau
S.
,
Gautreau
G.
et al. .
MicroScope: интегрированная платформа для аннотации и исследования функций микробных генов посредством сравнительного анализа генома, пангеномики и метаболизма
.
Nucleic Acids Res.
2019
; .53.
Дэвис
Дж. Дж.
,
Ваттам
А.Р.
,
Азиз
Р.К.
,
Brettin
T.
,
Butler
R.
,
Butler
R.M.
,
Chlenski
P.
,
Conrad
N.
,
Dickerman
A.
,
Dietrich
E.M.
et al. .
Центр ресурсов по биоинформатике PATRIC: расширение возможностей данных и анализа
.
Nucleic Acids Res.
2019
; .54.
Urban
M.
,
Cuzick
A.
,
Seager
J.
,
Wood
V.
,
Rutherford
K.
,
Venkatesh S.
,
De Silva
N.
,
Martinez
M.C.
,
Pedro
H.
,
Yates
AD
et al. .
PHI-base: база данных взаимодействий патоген-хозяин
.
Nucleic Acids Res.
2019
; .55.
Mitchell
AL
,
Almeida
A.
,
Beracochea
M.
,
Boland
M.
,
Burgin
J.
,
Cochrane 9000
MR
,
Kale
V.
,
Potter
SC
,
Richardson
LJ
et al. .
MGnify: ресурс для анализа микробиома в 2020 году
.
Nucleic Acids Res.
2019
; .56.
The Alliance of Genome Resources Consortium
Alliance of Genome Resources Portal: единая платформа исследования модельных организмов
.
Nucleic Acids Res.
2019
; .57.
Шефчек
К.А.
,
Харрис
N.L.
,
Gargano
M.
,
Matentzoglu
N.
,
Unni
D.
,
Brush
M.
,
Keith
D.
,
Conlin
T.
,
Vasilevsky
N.
,
Zhang
X.A.
et al. .
Инициатива монархов в 2019 году: интегративная платформа данных и аналитики, соединяющая фенотипы с генотипами по видам
.
Nucleic Acids Res.
2019
; .58.
Smith
J.R.
,
Hayman
G.T.
,
Ван
С.-J.
,
Лауледеркинд
S.J.F.
,
Hoffman
M.J.
,
Kaldunski
M.L.
,
Tutaj
M.
,
Thota
J.
,
Nalabolu
H.S.
,
Элланки
S.L.R.
et al. .
Год Крысы: база данных генома крысы в 20 лет: многовидовая база знаний и платформа для анализа
.
Nucleic Acids Res.
2019
; .59.
Ng
P.C.
,
Вонг
E.D.
,
Макферсон
К.А.
,
Александр
S.
,
Аргасинская
J.
,
Dunn
B.
,
Nash
R.S.
,
Skrzypek
M.S.
,
Gondwe
F.
,
Jha
S.
et al. .
Визуализация транскриптомов и доступность данных в базе данных генома Saccharomyces
.
Nucleic Acids Res.
2019
; .60.
Харрис
T.W.
,
Arnaboldi
V.
,
Cain
S.
,
Chan
J.
,
Chen
WJ
,
Cho
J.
,
Davis
Гао
S.
,
Grove
CA
,
Кишор
R.
et al. .
WormBase: информационный ресурс о современном модельном организме
.
Nucleic Acids Res.
2019
; .61.
Lu
F.
,
Wei
Z.
,
Luo
Y.
,
Guo
H.
,
Zhang
G.
,
Xia
Q. Wang
Y.
SilkDB 3.0: визуализация и изучение нескольких уровней данных для шелкопряда
.
Nucleic Acids Res.
2019
; .62.
Йейтс
А.D.
,
Achuthan
P.
,
Akanni
W.
,
Allen
J.
,
Alvarez-Jarreta
J.
,
MR
,
Armean
IM
,
Azov
AG
,
Bennett
R.
et al. .
Ensembl 2020
.
Nucleic Acids Res.
2019
; .63.
Howe
К.L.
,
Contreras-Moreira
B.
,
De Silva
N.
,
Maslen
G.
,
Akanni
W.
,
Allen
J.
,
Alvarez Jarreta
J.
,
Barba
M.
,
Bolser
DM
,
Cambell
L.
et al. .
Ensembl Genomes 2020 — возможность геномных исследований беспозвоночных
.
Nucleic Acids Res.
2019
; .64.
Левин
Х.А.
,
Робинсон
G.E.
,
Kress
W.J.
,
Baker
W.J.
,
Coddington
J.
,
Crandall
K.A.
,
Durbin
R.
,
Edwards
S.V.
,
Forest
F.
,
Gilbert
M.T.P.
et al. .
Earth BioGenome Project: последовательность жизни для будущего жизни
.
Proc. Natl. Акад. Sci. США
2018
;
115
:
4325
—
4333
0,65.
Singh
P.P.
,
Isambert
H.
OHNOLOGS v2: исчерпывающий ресурс по генам, оставшимся после дупликации всего генома у позвоночных
.
Nucleic Acids Res.
2019
; 0,66.
Армстронг
J.F.
,
Faccenda
E.
,
Harding
S.D.
,
Pawson
A.J.
,
Southan
C.
,
Sharman
J.L.
,
Campo
B.
,
Cavanagh
D.R.
,
Александр
S.P.H.
,
Давенпорт
A.P.
et al. .
Руководство IUPHAR / BPS по фармакологии в 2020 году: расширение содержания иммунофармакологии и введение Руководства IUPHAR / MMV по фармакологии малярии
.
Nucleic Acids Res.
2019
; 0,67.
Робинсон
Дж.
,
Баркер
Д.Дж.
,
Georgiou
X.
,
Cooper
MA
,
Flicek
P.
,
Marsh
S.G.E.
База данных IPD-IMGT / HLA
.
Nucleic Acids Res.
2019
; .68.
Гонсалес-Галарса
F.F.
,
McCabe
A.
,
Melo dos Santos
E.J.
,
Jones
J.
,
Takeshita
L.
,
Ortega-Rivera
N.D.
,
Del Cid-Pavon
G.M.
,
Ramsbottom
K.
,
Ghattaoraya
G.
,
Alfirevic
A.
et al. .
Обновление базы данных частоты аллелей (AFND) 2020: классификация данных золотого стандарта, данные генотипа в открытом доступе и новые инструменты запросов
.
Nucleic Acids Res.
2019
; 0,69.
Omer
A.
,
Shemesh
O.
,
Peres
A.
,
Polak
P.
,
Shepherd
A.J.
,
Watson
C.T.
,
Boyd
S.D.
,
Коллинз
A.M.
,
Lees
W.
,
Yaari
G.
VDJbase: база данных генотипов и гаплотипов адаптивного иммунного рецептора
.
Nucleic Acids Res.
2019
; .70.
Багаев
Д.В.
,
Вруманс
Р.М.А.
,
Samir
J.
,
Stervbo
U.
,
Rius
C.
,
Dolton
G.
,
Greenshields-Watson
A.
,
Atta
,
Егоров
ES
,
Звягин
И.В.
et al. .
VDJdb в 2019 г .: расширение базы данных, новая инфраструктура анализа и сборник мотивов рецепторов Т-клеток
.
Nucleic Acids Res.
2019
; .71.
Lees
W.
,
Busse
CE
,
Corcoran
M.
,
Ohlin
M.
,
Scheepers
C.
,
Matsen
г.
,
Watson
CT
,
Коллинз
A.
,
Shepherd
A.J.
et al. .
OGRDB: справочная база данных предполагаемых генов иммунных рецепторов
.
Nucleic Acids Res.
2019
; .72.
Beck
T.
,
Короче
T.
,
Brookes
A.J.
GWAS Central: исчерпывающий ресурс для обнаружения и сравнения данных генотипа и фенотипа из полногеномных ассоциативных исследований
.
Nucleic Acids Res.
2019
; .73.
Tian
D.
,
Wang
P.
,
Tang
B.
,
Teng
X.
,
Li
C.
,
Liu
X.
,
Zou
D.
,
Song
S.
,
Zhang
Атлас GWAS: курируемый ресурс общегеномных ассоциаций вариантных признаков у растений и животных
.
Nucleic Acids Res.
2019
; .74.
Wang
J.
,
Huang
D.
,
Zhou
Y.
,
Yao
H.
,
Liu
H.
,
Zhai
S.
,
Wu
C.
,
Zheng
Z.
,
Zhao K.
Wang
Z.
et al. .
CAUSALdb: база данных причинных вариантов заболеваний / признаков, идентифицированных с использованием сводной статистики полногеномных ассоциативных исследований
.
Nucleic Acids Res.
2019
; .75.
Цзя
п.
,
Dai
Y.
,
Hu
R.
,
Pei
G.
,
Manuel
A.M.
,
Zhao
Z.
TSEA-DB: карта ассоциации «признак-ткань» для комплексных признаков и болезней человека
.
Nucleic Acids Res.
2019
; .76.
Gao
Y.
,
Zhang
C.
,
Yuan
L.
,
Ling
Y.
,
Wang
X.
,
Liu
C.
,
Pan
Y.
,
Zhang
X.
,
Ma
X.
,
000 Wang
al. .
PGG .Han: китайская база данных генома и платформа анализа
.
Nucleic Acids Res.
2019
; .77.
Wang
Y.
,
Zhang
S.
,
Li
F.
,
Zhou
Y.
,
Zhang
Y.
,
Wang
Z.
,
Zhang
R.
,
Zhu
J.
,
Ren
Tan
Y.
et al. .
База данных терапевтических целей 2020: расширенный ресурс для содействия исследованиям и ранней разработке целевых терапевтических средств
.
Nucleic Acids Res.
2019
; .78.
Ландабуру
Л.U.
,
Berenstein
A.J.
,
Videla
S.
,
Maru
P.
,
Shanmugam
D.
,
Chernomoretz
A.
,
Agüero
F.
Target Discovery для патогенов человека посредством интенсивной интеграции хемогеномных данных
.
Nucleic Acids Res.
2019
; .79.
Ландрам
M.J.
,
Chitipiralla
S.
,
Коричневый
G.R.
,
Chen
C.
,
Gu
B.
,
Hart
J.
,
Hoffman
D.
,
Jang
W.
,
Kaur
K.
Лю
C.
et al. .
ClinVar: улучшения доступа к данным
.
Nucleic Acids Res.
2019
; .80.
Piñero
J.
,
Ramírez-Anguita
J.M.
,
Saüch-Pitarch
J.
,
Ronzano
F.
,
Centeno
E.
,
Sanz
F.
,
Furlong
L.I.
Платформа знаний DisGeNET для геномики болезней: обновление 2019
.
Nucleic Acids Res.
2019
; .81.
Wang
C.
,
Yang
J.
,
Luo
H.
,
Wang
K.
,
Wang
Y.
,
Xiao
Z.-X.
,
Tao
X.
,
Jiang
H.
,
Cai
H.
CancerTracer: курируемая база данных по внутрибольничной гетерогенности опухолей
.
Nucleic Acids Res.
2019
; .82.
Ding
W.
,
Chen
J.
,
Feng
G.
,
Chen
G.
,
Wu
J.
,
Guo
Y.
,
Ni
X.
,
Shi
T.
DNMIVD: база данных интерактивной визуализации метилирования ДНК
.
Nucleic Acids Res.
2019
; .83.
Tian
F.
,
Yang
D.-C.
,
Мэн
Y.-Q.
,
Jin
J.
,
Gao
G.
PlantRegMap: построение функциональных нормативных карт на заводах
.
Nucleic Acids Res.
2019
; .84.
Togninalli
M.
,
Seren
Ü.
,
Freudenthal
J.A.
,
Монро
J.G.
,
Meng
D.
,
Nordborg
M.
,
Weigel
D.
,
Borgwardt
K.
,
Korte
A.
,
Grimm 9000.
AraPheno и каталог AraGWAS 2020: крупное обновление базы данных, включая данные о РНК-Seq и нокаут-мутациях для Arabidopsis thaliana
.
Nucleic Acids Res.
2019
; .85.
Wang
D.
,
Вентилятор
W.
,
Guo
X.
,
Wu
K.
,
Zhou
S.
,
Chen
,
Z. Li
D.
,
Wang
K.
,
Zhu
Y.
,
Zhou
Y.
MaGenDB: функциональный центр геномики для растений Malvaceae
.
Nucleic Acids Res.
2019
; .86.
Peng
H.
,
Wang
K.
,
Chen
Z.
,
Cao
Y.
,
Gao
Q.
,
Li
Li
X.
,
Lu
H.
,
Du
H.
,
Lu
M.
et al. .
MBKbase для риса: интегрированная база знаний omics для молекулярной селекции риса
.
Nucleic Acids Res.
2019
; .87.
Deutsch
E.W.
,
Bandeira
N.
,
Sharma
V.
,
Perez-Riverol
Y.
,
Carver
J.J.
,
Кунду
D.J.
,
García-Seisdedos
D.
,
Jarnuczak
A.F.
,
Hewapathirana
S.
,
Pullman
B.S.
et al..
Консорциум ProteomeXchange в 2020 году: использование подходов «больших данных» в протеомике
.
Nucleic Acids Res.
2019
; .88.
Самарас
P.
,
Schmidt
T.
,
Frejno
M.
,
Gessulat
S.
,
Reinecke
M.
,
0005 Jar Zecha
J.
,
Mergner
J.
,
Giansanti
P.
,
Эрлих
H.-C.
et al. .
ProteomicsDB: мультикомический и мульти-организмный ресурс для исследований в области наук о жизни
.
Nucleic Acids Res.
2019
; .89.
Shao
X.
,
Taha
I.N.
,
Clauser
K.R.
,
Naba
A.
MatrisomeDB: база данных знаний о ECM-белках
.
Nucleic Acids Res.
2019
; .90.
Nizami
B.
,
Bereczki-Szakál
D.
,
Varró
N.
,
el Battioui
K.
,
Nagaraj
V.U.
,
Szigyártó
I.C.
,
Mándity
I.
,
Beke-Somfai
T.
FoldamerDB: база данных пептидных фолдамеров
.
Nucleic Acids Res.
2019
; .91.
Рубах
П.
,
Zajac
S.
,
Jastrzebski
B.
,
Sulkowska
J.I.
,
Sułkowski
P.
Род биомолекул
.
Nucleic Acids Res.
2019
; .
© Автор (ы) 2020. Опубликовано Oxford University Press от имени Nucleic Acids Research.
Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License (http: // creativecommons.org / licenses / by / 4.0 /), который разрешает неограниченное повторное использование, распространение и воспроизведение на любом носителе при условии правильного цитирования оригинальной работы.
C-Store: столбчатая база данных. Введение | by Ameya
Введение
C-store было одним из первых проектов баз данных, которые привели к развитию баз данных, которые были сосредоточены на подходах к хранению, ориентированных на столбцы. До этого обычным шаблоном проектирования было хранение записей базы данных в виде непрерывных строк.C-store фокусируется на рабочих нагрузках, оптимизированных для чтения, таких как хранилище данных, а также поддерживает нечастую рабочую нагрузку записи. Существует множество приложений, таких как хранилища данных или CRM, которым необходимо загружать данные один раз и выполнять несколько интерактивных запросов к этим данным. Такая рабочая нагрузка выиграет от оптимизации чтения. В базах данных, ориентированных на столбцы, можно занести в память только необходимые атрибуты / столбцы и провести необходимый анализ. Если бы эти данные хранились в виде строк, необходимо было бы получить доступ к множеству ненужных атрибутов или перенести их в память.Еще одним дополнительным преимуществом хранения, ориентированного на столбцы, является то, что атрибуты одного столбца имеют один и тот же тип данных и, следовательно, могут быть закодированы для эффективного хранения и извлечения (для хранения, ориентированного на строки, это становится непросто). C-store хранит группу столбцов, отсортированных по некоторому ключу, в физически непрерывном пространстве — такая группа называется проекцией. Кроме того, C-Store предполагает распределенную архитектуру, в которой разные проекции могут попадать на разные узлы системы. C-Store поддерживает k-безопасный режим отказа i.e. база данных доступна, и данные можно восстановить / запросить, даже если k узлов в системе выйдут из строя. Поскольку один и тот же столбец может принадлежать нескольким проекциям, и эти проекции могут попадать на разные узлы, в системе существует естественная избыточность, которая помогает в случае сбоев узлов.
Чтобы поддерживать оптимизированную для чтения рабочую нагрузку и избежать проблем с параллелизмом / блокировкой при рабочей нагрузке на основе записи, C-Store использует два логических набора: Writable-Store (WS) и Readable-Store (RS). Все записи происходят в WS, и компонент движка кортежей периодически перемещает измененные записи в RS с помощью процесса слияния.Для поддержки доступа к RS без блокировок создается моментальный снимок RS (до самого недавнего прошлого), который затем может использоваться для запросов без каких-либо блокировок — этот механизм называется изоляцией моментального снимка.
Высокоуровневые компоненты C-Store
Модель данных
C-Store поддерживает традиционные модели баз данных таблиц, состоящих из столбцов в качестве атрибутов и концепций первичных и внешних ключей. Большинство хранилищ строк физически хранят данные в табличном формате с индексами, используемыми для ускорения доступа.C-Store хранит только семейства столбцов (проекции) физически непрерывно. Проекции C-Store состоят из столбца из данной таблицы — этот столбец является якорем прогноза. Одна и та же проекция может содержать другие столбцы из той же таблицы или других таблиц, если привязка может быть сопоставлена со сторонней таблицей. Например, если есть две таблицы с именами EMP (имя, возраст, зарплата, отдел) и DEPT (имя, пол), тогда прогноз EMP1 может быть:
EMP1: (имя, отдел, DEPT.dname | имя)
Для проекции EMP1 каждый столбец хранится отдельно. Порядок значений в этой проекции зависит от ключа сортировки, обозначенного здесь именем столбца после символа «|». Каждая такая проекция делится на еще один сегмент, и каждому сегменту присваивается SID. Эта сегментация основана на ключе сортировки, и, следовательно, каждый сегмент в основном представляет собой диапазон ключей для этого сегмента. Здесь следует отметить одну важную вещь: все строки / значения в базе данных должны быть реконструированы из различных проекций — это называется «покрывающим набором» проекций.
Для представления всей таблицы или всех записей, которые должен возвращать запрос, используются индексов соединения и ключей хранения . Ключи хранения используются для представления логической строки или кортежа в данном сегменте. Ключи хранилища хранятся в WS, но не хранятся в RS. Индексы объединения используют ключи хранилища для создания исходных таблиц в нескольких сегментах. Если две проекции T1 и T2 могут охватывать всю таблицу, то запись индекса объединения состоит из (ID сегмента, ключа хранения) T2 для соответствующих ключей в T1.Вот пример индекса объединения, который отображает проекцию EMP1 (имя, возраст | возраст) в EMP3 (имя, зарплата | зарплата).
Индекс соединения на основе «имени»
Поддержание индекса соединения дорого. Любое обновление проекции приводит к обновлению индекса входящего или исходящего соединения.
RS: оптимизированное для чтения хранилище
Оптимизированное для чтения хранилище использует эффективные схемы кодирования, основанные на распределении данных в столбцах, например Для столбца, состоящего из нескольких уникальных значений, он может использовать схему типа кодирования длин серий, которую можно описать как (появление в столбце, значение, частота).Точно так же для столбца, состоящего из множества различных значений, можно сохранить первое значение в столбце, за которым следуют дельты от первого значения — это поможет уменьшить общий размер, необходимый для хранения дельт и, следовательно, столбца. Индексы соединения также хранятся в RS — как мы обсуждали ранее, на самом деле это два столбца, состоящие из кортежа (идентификатор сегмента, ключ хранилища).
WS: Оптимизированное для записи хранилище
Здесь находятся все последние измененные данные. Имеет смысл иметь аналогичную структуру для WS и RS, чтобы избежать написания оптимизаторов запросов по-разному.Единственное отличие, которое существует в WS, заключается в том, что столбцы не хранятся в закодированном формате — для облегчения текущих обновлений. Между WS и RS существует отображение 1: 1 — sid и storage-key (SK) идентифицируют один и тот же кортеж в обоих. sid явно хранится в WS. Новый sid создается, когда новое значение вставляется в WS. Столбец представлен в виде пары (значение, SK). B-деревья на SK используются для представления этих столбцов. Кроме того, вся проекция представлена как (s, SK), где s — это ключ сортировки. Комбинация индекса сортировки и индекса на основе необработанного ключа хранилища обеспечивает эффективный доступ к атрибутам во время сканирования / запросов.
Управление хранилищем
Сегменты — это единица работы в C-Store. Из-за распределенной природы базы данных она использует распределитель памяти для назначения определенных сегментов конкретным узлам. Некоторые идеи, представленные в документе, включают размещение следующих элементов: одинаковые столбцы в проекции, одинаковые сегменты RS и WS, сегмент отправителя, такой как EMP3, и индекс соединения на рисунке выше.
Обновления и транзакции
Вставки происходят в WS, и это означает обновление всех столбцов в данной проекции, а также столбца с отсортированными ключами.Это изменение может сначала попасть на любой из узлов в системе, и поэтому этот узел отвечает за создание нового ключа хранения для этой записи. Уникальный ключ хранилища получается комбинацией node_id + local_counter. Этот local_counter уникален и больше, чем самый большой ключ в RS, чтобы гарантировать уникальное значение для всех узлов. Блокировка сводится к минимуму за счет изоляции моментальных снимков — основная идея заключается в том, что запросы на чтение используют какой-то моментальный снимок из прошлого, который является неизменным.
Изоляция моментального снимка
Чтобы обеспечить изоляцию моментального снимка, важно отметить эпохи (временные диапазоны), в которые были вставлены или удалены записи.WS поддерживает вектор вставки (IV) и вектор удаленной записи (DRV) для каждой логической записи в данном сегменте. Все записи, вставленные или удаленные до низкого уровня водяного знака (объяснено позже), будут видны любому запросу. Глядя на IV и DRV, механизм выполнения может выяснить, должна ли запись быть видима для этого запроса или нет. Если вы думаете о времени сверху вниз, верхний водяной знак (HWM) обозначает время, в которое запускалась изоляция моментальных снимков. Низкий водяной знак (LWM) указывает самое позднее время, когда запрос только для чтения может быть запущен для моментального снимка.
Создание и поддержка HWM и эпох
C-Store не отслеживает время с высокой точностью. Он делит время на эпохи (несколько секунд или более), а затем обеспечивает изоляцию снимков на основе номера эпохи. Как показано на рисунке выше, существует орган временной метки (TA), который назначает эпоху всем узлам и поддерживает HWM. Он отправляет сообщение «начало эпохи» всем узлам, чтобы указать, что должна начаться новая эпоха. Каждый узел отправляет сообщение «Эпоха завершена» обратно, когда завершаются некоторые транзакции из более ранней эпохи.Когда TA получает обратно все полные сообщения, он объявляет о новом HWM «e» всем узлам — это изолированный моментальный снимок. Текущая эпоха в системе — e + 1, которая обновляется, но не видна запросам. Перемещение кортежей гарантирует, что никакие записи в RS не были созданы после LWM — это помогает RS не поддерживать IV.
Распределенные коммиты
Для поддержки коммитов на разных узлах каждая транзакция получает мастер. Мастер отвечает за разделение работы транзакции и назначение ее многим узлам.Мастер ждет, пока все узлы закончат свою работу. Затем он отправляет сообщение «фиксация» всем узлам и может снять блокировки и удалить журнал UNDO, когда все узлы получат это сообщение.
Восстановление
Восстановление состоит из трех основных случаев:
- Когда на отказавшем узле сохраняются данные. В этом случае его можно восстановить, выполнив обновления, которые были поставлены в другую очередь.
- Если и WS, и RS вышли из строя и потеряли данные на данном узле, то их необходимо восстановить с использованием проекций и индексов соединения на другом сайте.
- Самый распространенный случай — когда RS не поврежден, но WS поврежден.С этим сценарием можно справиться эффективно, учитывая, что это наиболее распространенный сценарий. В документе содержится более подробная информация об этом.
Перемещение кортежей
Перемещение кортежей — это процесс слияния, который выполняется в фоновом режиме для перемещения квалифицированных блоков кортежей из WS в RS. LWM — это, по сути, самое раннее эффективное время, в которое может быть запущена транзакция только для чтения. Перемещение кортежей должно гарантировать, что все транзакции до LWM доступны в RS. Кортежи в WS с удаленной меткой времени меньше LWM отбрасываются, поскольку они не должны быть видны ни одному запросу.Недавно вставленные кортежи добавляются в RS. Это слияние выполняется с использованием нового временного сегмента. Это означает, что каждый кортеж получает новый ключ хранилища и SID. Это означает, что индексы соединения также необходимо поддерживать.
Заключение
C-store представляет столбчатую базу данных с новой концепцией изоляции WS для эффективной записи и RS для эффективной рабочей нагрузки с большим количеством операций чтения. Он также поддерживает распределенный механизм фиксации с использованием мастера транзакций, таким образом поддерживая полностью распределенную базу данных.Схемы кодирования, не описанные в этом посте (находятся в документе), также обеспечивают эффективный механизм для эффективного хранения.
Поиск освобожденных от налогов организаций
В целом, физическое лицо, которое перечисляет вычеты, может вычитать взносы в большинство благотворительных организаций в размере до 50% (60% для денежных взносов)% от его или ее скорректированного валового дохода, рассчитанного без учета переноса чистых операционных убытков . Как правило, физические лица могут вычитать благотворительные взносы в другие организации в размере до 30% от их скорректированного валового дохода (рассчитанного без учета переноса чистых операционных убытков).Эти ограничения (и статус организации) указаны следующим образом:
Код | Тип организации и использование вклада. | Ограничение франшизы |
---|---|---|
ПК | Общественная благотворительность. | 50% (60% для денежных взносов) |
POF | Частный действующий фонд. | 50% (60% для денежных взносов) |
пф | Частный фонд. | 30% (обычно) |
ГРУППА | Как правило, центральная организация, имеющая групповое освобождение от налогов, подчиненные подразделения которой, подпадающие под действие группового освобождения, также имеют право на получение не подлежащих налогообложению взносов, даже если они не указаны отдельно. | Зависит от разных факторов |
ЛОДЖА | Домашнее братское общество, действующее по системе лож, но только если пожертвования будут использоваться исключительно на благотворительные цели. | 30% |
UNKWN | Благотворительная организация, статус общественной благотворительной организации не определен. | Зависит от разных факторов |
EO | Организация, описанная в разделе 170 (c) Налогового кодекса, кроме общественной благотворительной организации или частного фонда. | Зависит от разных факторов |
FORGN | Организация с иностранным адресом.Как правило, это организации, созданные в Соединенных Штатах и осуществляющие деятельность за рубежом. Некоторые иностранные организации, получающие благотворительные взносы, вычитаемые в соответствии с договором, также включены в этот список, как и организации, созданные в собственности США. | Зависит от разных факторов |
СО | Поддерживающая организация типа I, типа II или функционально интегрированная организация типа III. | 50% (60% для денежных взносов) |
СОНФИ | Нефункционально интегрированная вспомогательная организация типа III. | 50% (60% для денежных взносов) |
СОУНК | Поддерживающая организация неустановленного типа. | 50% (60% для денежных взносов) |
Взносы должны фактически выплачиваться наличными или иным имуществом до окончания налогового года физического лица, чтобы они могли вычитаться за этот налоговый год, независимо от того, использует ли физическое лицо денежный метод или метод начисления.