Возможен ли асинхронный вызов jdbc?

Question

Возможен ли асинхронный вызов jdbc?

122

Интересно, есть ли способ сделать асинхронные вызовы в базе данных?

Например, представьте, что у меня большой запрос, который занимает очень много времени для обработки, я хочу отправить запрос и получить уведомление, когда запрос вернет значение (передав Listener/callback или что-то еще), Я не хочу блокировать ожидание ответа базы данных.

Я не считаю, что использование пула потоков является решением, потому что оно не масштабируется, в случае тяжелых параллельных запросов это порождает очень большое количество потоков.

Мы сталкиваемся с такой проблемой с сетевыми серверами, и мы нашли решения, используя системный вызов select/poll/epoll, чтобы избежать использования одного потока для каждого соединения. Мне просто интересно, как иметь подобную функцию с запросом базы данных?

Примечание: Я знаю, что использование FixedThreadPool может быть хорошей практикой, но я удивлен, что никто не разработал систему, которая действительно асинхронна (без использования дополнительного потока).

** Обновление **
Из-за отсутствия реальных практических решений я решил сам создать библиотеку (часть finagle): finagle-mysql. Он в основном декодирует/декодирует запрос/ответ mysql и использует Finagle/Netty под капотом. Он очень хорошо масштабируется даже при большом количестве подключений.

Steve Gury 03 нояб. 2010, в 12:40

Источник

0

См. Code.google.com/p/async-mysql-connector/wiki/UsageExample
John Smith 30 сен. 2012, в 07:17
1

Смотрите также github.com/mauricio/postgresql-async
Daniel Worthington-Bodart 14 авг. 2014, в 07:52
0

Проблема в том, как БД может уведомить клиента о завершении запроса. Можно было бы (например), чтобы Oracle использовал функцию «Уведомление об изменении результата запроса базы данных» и получал уведомление при изменении данных в БД. Это относится к запросам SQL, которые изменяют данные базы данных. Для запросов только для чтения это не будет работать. С другой стороны, я не уверен, что создание асинхронных соединений было бы хорошей идеей, поскольку их установка обходится дорого. Конечно, это не очень общее решение. Просто пища для размышлений ...
Mike Argyriou 18 сен. 2015, в 12:08
0

Finagle-mysql использует JDBC?
Saeed Zarinfam 05 янв. 2017, в 05:02

Показать ещё 2 комментария

Теги:

java

scala

asynchronous

jdbc

nonblocking

13 ответов

38

Невозможно выполнить асинхронный вызов базы данных через JDBC, но вы можете сделать асинхронные вызовы в JDBC с помощью Актеров (например, актер совершает вызовы в БД через JDBC и отправляет сообщения в третьи стороны, когда вызовы закончены), или, если вам нравится CPS, конвейерные фьючерсы (promises) (хорошая реализация Scalaz Promises)

Я не считаю, что использование пула потоков является решением, потому что оно не масштабируется, в случае тяжелых параллельных запросов это порождает очень большое количество потоков.

Scala субъекты по умолчанию основаны на событиях (не на основе потоков) - планирование продолжения позволяет создавать миллионы участников на стандартной установке JVM.

Если вы ориентируетесь на Java, Akka Framework является реализацией модели Actor, которая имеет хороший API как для Java, так и для Scala.

Кроме того, синхронный характер JDBC имеет для меня прекрасный смысл. Стоимость сеанса базы данных намного выше, чем затраты на поток Java, который блокируется (как на переднем, так и на заднем плане) и ожидает ответа. Если ваши запросы выполняются так долго, что возможности службы-исполнителя (или обертывания фреймворков Actor/fork-join/prom

Vasil Remeniuk 03 нояб. 2010, в 15:44

0

+1. Я обернул дорогие вызовы JDBC (технически, Querulous) в актеров и никогда не оглядывался назад.
Max A. 03 нояб. 2010, в 15:10
0

Я нацеливаюсь на scala, и я очень хорошо знаком с паттерном Promise / Actor. На самом деле я не рассматривал модель актера, потому что я все еще хочу выполнять запросы параллельно, я не хочу иметь большого актера, который выполняет все мои запросы последовательно. Моя первая идея состояла в том, чтобы использовать Promises, поддерживаемые FixedThreadPool с тем же размером, что и количество подключений к БД. В случае интенсивного использования каждый поток пула потоков блокируется в ожидании БД. Меня раздражает то, что все эти потоки не нужны, вполне возможно иметь эквивалентную систему с одним потоком.
Steve Gury 04 нояб. 2010, в 14:42
0

Стив, просто создать нового актера для каждого звонка?
Viktor Klang 05 нояб. 2010, в 20:50
2

@Victor, каждый актер, работающий параллельно над операцией блокировки (JDBC), будет работать в отдельном потоке, которого Стив пытается избежать
Vasil Remeniuk 05 нояб. 2010, в 21:06
33

Подход субъекта по-прежнему требует одного потока на активную транзакцию базы данных, пока транзакция продолжается, так что это на самом деле не является решением проблемы OP, если вы не хотите ограничить число параллельных транзакций базы данных и ожидать некоторых «асинхронных» операций с базой данных. для некоторых уже исполняющихся, чтобы закончить и освободить поток. Однако это неплохая идея - база данных может быть перегружена, если вы откроете слишком много подключений, поэтому размещение транзакции базы данных в очереди для обработки вместо блокировки потока обработки http-запроса поможет.
Dobes Vandermeer 20 март 2012, в 03:52
0

Я не думаю, что это невозможно ... code.google.com/p/async-mysql-connector/wiki/UsageExample - говоря, что я еще не попробовал код ...
John Smith 30 сен. 2012, в 07:16
7

Решение на основе актера все еще блокирует поток. Не говорите, что невозможно выполнить асинхронный вызов jdbc, есть экспериментальные библиотеки с открытым исходным кодом, которые пытаются реализовать асинхронный jdbc.
user452425 04 окт. 2013, в 08:15
4

+1 «Стоимость сеанса базы данных намного выше стоимости блокировки потока Java»
Paul Draper 23 апр. 2014, в 16:19
0

Для дорогих вызовов в БД проблема обычно не такая уж большая. Именно когда вызов является тривиальным, сетевые издержки становятся проблемой. Если вы хотите сделать 100 запросов, каждый из которых занимает 1 мс для БД, но нагрузка на сеть составляет 200 мс, то синхронно это займет более 20 секунд, но асинхронно займет 300 мс.
morten 18 дек. 2017, в 09:08

Показать ещё 7 комментариев

10

Возможно, вы могли бы использовать систему асинхронных сообщений JMS, которая очень хорошо масштабируется, ИМХО:

Отправить сообщение в очередь, где подписчики будут принимать это сообщение и запустить SQL-процесс. Ваш основной процесс продолжит выполнение и принятие или отправку новых запросов.
Когда процесс SQL заканчивается, вы можете запустить обратный путь: отправить сообщение ResponseQueue с результатом процесса, а слушатель на стороне клиента принять его и выполнить код обратного вызова.

Tomas Narros 03 нояб. 2010, в 15:53

7

В JDBC нет прямой поддержки, но у вас есть несколько параметров, таких как MDB, Executors из Java 5.

"Я не считаю, что использование пула потоков является решением, потому что оно не масштабируется, в случае тяжелых одновременных запросов это порождает очень большое количество потоков".

Мне любопытно, почему ограниченный пул потоков не будет масштабироваться? Это пул, а не поток на запрос, чтобы порождать поток за каждый запрос. Я использую это довольно часто в режиме большой загрузки webapp, и мы пока не видели никаких проблем.

Aravind R. Yarram 03 нояб. 2010, в 14:59

0

Я думаю, что основной аргумент против потоков заключается в том, что вы в основном находитесь за пределами каких-либо стандартных ограничений контейнеров Java, поэтому вы теряете управляемую контейнером кластеризацию и отказоустойчивые возможности, хотя вы можете свернуть свои собственные или использовать что-то вроде терракоты.
mezmo 03 нояб. 2010, в 15:12
3

мы можем подключиться к опросам управляемых потоков сервера приложений с помощью рабочих менеджеров. websphere, weblogic и glassfish поддерживают его
Aravind R. Yarram 03 нояб. 2010, в 16:24

3

Старый вопрос, но еще немного информации. Невозможно, чтобы JDBC выдавал асинхронные запросы самой базе данных, если поставщик не предоставляет расширение JDBC и оболочку для обработки JDBC. Тем не менее, можно обернуть сам JDBC очереди обработки и реализовать логику, которая может обрабатывать очередь на одном или нескольких отдельных соединениях. Одним из преимуществ этого для некоторых типов вызовов является то, что логика, если она находится при достаточно большой нагрузке, может преобразовывать вызовы в пакеты JDBC для обработки, что значительно ускорит логику. Это наиболее полезно для вызовов, где данные вставляются, и фактический результат нужно регистрировать только в случае возникновения ошибки. Хорошим примером этого является то, что для регистрации активности пользователя выполняются вставки. Приложение не заботится, будет ли вызов завершен немедленно или через несколько секунд.

В качестве побочного примечания один продукт на рынке обеспечивает политический подход к разрешению асинхронных вызовов, подобных тем, которые я описал, асинхронно (http://www.heimdalldata.com/). Отказ от ответственности: Я являюсь соучредителем этой компании. Это позволяет использовать регулярные выражения для запросов преобразования данных, таких как вставка/обновление/удаление для любого источника данных JDBC, и будет автоматически их совместно обрабатывать для обработки. При использовании с MySQL и параметром rewriteBatchedStatements (MySQL и JDBC с rewriteBatchedStatements = true) это может значительно снизить общую нагрузку на базу данных.

Erik Brandsberg 30 нояб. 2015, в 22:31

0

Но это все еще означает, что JDBC должен иметь хотя бы один отдельный поток. Как насчет каркасов и стеков, которые являются однопоточными, но все еще основаны на обратном вызове (на ум приходит nodejs)? Вы знаете, как они управляют вызовами JDBC?
yuranos87 14 июнь 2017, в 13:01

3

Проект Ajdbc, кажется, отвечает на эту проблему http://code.google.com/p/adbcj/

В настоящее время существует 2 экспериментальных асинхронных драйвера для mysql и postgresql.

Sebastien 04 май 2013, в 00:21

0

Я хотел бы, чтобы этот подход был готов. JDBC с самого начала сильно развивался (итераторы, шаблоны, подготовленные процедуры), но этот асинхронный подход никогда не был реализован. Это было бы особенно интересно для операций записи (Вставка, Обновление, Удаление), и особенно тех тяжелых TX, с которыми мы все сталкиваемся. По моему мнению, любой вид клиентского подхода (объединение в пул, актер, планирование, обмен сообщениями ...) приведет к небольшому вознаграждению с точки зрения использования ресурсов (возможно, некоторый выигрыш в пропускной способности или задержке).
Jaime Casero 15 апр. 2015, в 09:16
0

Старые и заброшенные, поддерживаются только два типа данных и даже не готовы к работе. К несчастью :(
Aaron Zinman 10 июнь 2015, в 20:24
0

Вопрос № 1 этой библиотеки о недоступности веб-сайта . Ему больше года. Я подозреваю, что эта библиотека довольно мертва.
Lukas Eder 15 июнь 2015, в 06:53

Показать ещё 1 комментарий

3

Java 5.0-исполнители могут пригодиться.

У вас может быть фиксированное количество потоков для обработки длительных операций. Вместо Runnable вы можете использовать Callable, которые возвращают результат. Результат заключен в объект Future<ReturnType>, поэтому вы можете получить его, когда он вернется.

Bozho 04 нояб. 2010, в 11:14

2

У меня есть три варианта:

Используйте параллельную очередь для распространения сообщений через небольшое и фиксированное количество потоков. Так что если у вас 1000 соединений, у вас будет 4 потока, а не 1000 потоков.
Доступ к базе данных на другом node (т.е. другой процесс или машина) и клиент базы данных асинхронные сетевые вызовы, чтобы node.
Реализовать истинную распределенную систему через асинхронные сообщения. Для этого вам понадобится очередь сообщений, такая как CoralMQ или Tibco.

Diclaimer: Я один из разработчиков CoralMQ.

rdalmeida 09 фев. 2016, в 22:17

2

Просто сумасшедшая идея: вы можете использовать шаблон Iteratee по результирующему набору JBDC, заключенному в Future/Promise

Хаммерсмит делает это для MongoBd.

jwinandy 04 авг. 2011, в 23:17

1

Не исправляет, что он все еще где-то блокирует поток.
Aaron Zinman 10 июнь 2015, в 20:24

1

Похоже, что новый асинхронный jdbc API "JDBC следующий" находится в работе.

См. презентация здесь

Вы можете загрузить API из здесь

Sebastien 19 март 2018, в 08:55

1

перенаправленная ссылка, которая указывает на более свежую реализацию, находится здесь: oracle.com/goto/java-async-db
Remigius Stalder 05 апр. 2018, в 08:24

1

Ниже приведен пример того, что неблокирующий jdbc api может выглядеть как Oracle, представленный на JavaOne: https://static.rainfocus.com/oracle/oow16/sess/1461693351182001EmRq/ppt/CONF1578%2020160916.pdf

Итак, похоже, что в конечном итоге действительно будут асинхронные вызовы JDBC.

nemoo 23 нояб. 2017, в 10:54

0

Это не JDBC, а дополнительный API
yaccob 03 июль 2018, в 08:10

1

Библиотека commons-dbutils поддерживает AsyncQueryRunner, который вы предоставляете ExecutorService, и возвращает Future. Стоит проверить, как это просто использовать и гарантировать, что вы не будете утечки ресурсов.

William Speirs 23 нояб. 2011, в 03:50

1

Я просто думаю об этом здесь. Почему у вас не было пула соединений с базой данных, каждый из которых имеет поток. Каждый поток имеет доступ к очереди. Когда вы хотите выполнить запрос, который занимает много времени, вы можете поставить очередь, а затем один из потоков подберет его и обработает. У вас никогда не будет слишком много потоков, потому что количество ваших потоков ограничено.

Изменить: Или еще лучше, просто несколько потоков. Когда поток видит что-то в очереди, он запрашивает соединение из пула и обрабатывает его.

Amir Raminfar 03 нояб. 2010, в 15:29

Ещё вопросы

См. Code.google.com/p/async-mysql-connector/wiki/UsageExample
Смотрите также github.com/mauricio/postgresql-async
Проблема в том, как БД может уведомить клиента о завершении запроса. Можно было бы (например), чтобы Oracle использовал функцию «Уведомление об изменении результата запроса базы данных» и получал уведомление при изменении данных в БД. Это относится к запросам SQL, которые изменяют данные базы данных. Для запросов только для чтения это не будет работать. С другой стороны, я не уверен, что создание асинхронных соединений было бы хорошей идеей, поскольку их установка обходится дорого. Конечно, это не очень общее решение. Просто пища для размышлений ...
+1. Я обернул дорогие вызовы JDBC (технически, Querulous) в актеров и никогда не оглядывался назад.
Я нацеливаюсь на scala, и я очень хорошо знаком с паттерном Promise / Actor. На самом деле я не рассматривал модель актера, потому что я все еще хочу выполнять запросы параллельно, я не хочу иметь большого актера, который выполняет все мои запросы последовательно. Моя первая идея состояла в том, чтобы использовать Promises, поддерживаемые FixedThreadPool с тем же размером, что и количество подключений к БД. В случае интенсивного использования каждый поток пула потоков блокируется в ожидании БД. Меня раздражает то, что все эти потоки не нужны, вполне возможно иметь эквивалентную систему с одним потоком.
Стив, просто создать нового актера для каждого звонка?
@Victor, каждый актер, работающий параллельно над операцией блокировки (JDBC), будет работать в отдельном потоке, которого Стив пытается избежать
Подход субъекта по-прежнему требует одного потока на активную транзакцию базы данных, пока транзакция продолжается, так что это на самом деле не является решением проблемы OP, если вы не хотите ограничить число параллельных транзакций базы данных и ожидать некоторых «асинхронных» операций с базой данных. для некоторых уже исполняющихся, чтобы закончить и освободить поток. Однако это неплохая идея - база данных может быть перегружена, если вы откроете слишком много подключений, поэтому размещение транзакции базы данных в очереди для обработки вместо блокировки потока обработки http-запроса поможет.
Я не думаю, что это невозможно ... code.google.com/p/async-mysql-connector/wiki/UsageExample - говоря, что я еще не попробовал код ...
Решение на основе актера все еще блокирует поток. Не говорите, что невозможно выполнить асинхронный вызов jdbc, есть экспериментальные библиотеки с открытым исходным кодом, которые пытаются реализовать асинхронный jdbc.
+1 «Стоимость сеанса базы данных намного выше стоимости блокировки потока Java»
Для дорогих вызовов в БД проблема обычно не такая уж большая. Именно когда вызов является тривиальным, сетевые издержки становятся проблемой. Если вы хотите сделать 100 запросов, каждый из которых занимает 1 мс для БД, но нагрузка на сеть составляет 200 мс, то синхронно это займет более 20 секунд, но асинхронно займет 300 мс.
Я думаю, что основной аргумент против потоков заключается в том, что вы в основном находитесь за пределами каких-либо стандартных ограничений контейнеров Java, поэтому вы теряете управляемую контейнером кластеризацию и отказоустойчивые возможности, хотя вы можете свернуть свои собственные или использовать что-то вроде терракоты.
мы можем подключиться к опросам управляемых потоков сервера приложений с помощью рабочих менеджеров. websphere, weblogic и glassfish поддерживают его
Но это все еще означает, что JDBC должен иметь хотя бы один отдельный поток. Как насчет каркасов и стеков, которые являются однопоточными, но все еще основаны на обратном вызове (на ум приходит nodejs)? Вы знаете, как они управляют вызовами JDBC?
Я хотел бы, чтобы этот подход был готов. JDBC с самого начала сильно развивался (итераторы, шаблоны, подготовленные процедуры), но этот асинхронный подход никогда не был реализован. Это было бы особенно интересно для операций записи (Вставка, Обновление, Удаление), и особенно тех тяжелых TX, с которыми мы все сталкиваемся. По моему мнению, любой вид клиентского подхода (объединение в пул, актер, планирование, обмен сообщениями ...) приведет к небольшому вознаграждению с точки зрения использования ресурсов (возможно, некоторый выигрыш в пропускной способности или задержке).
Старые и заброшенные, поддерживаются только два типа данных и даже не готовы к работе. К несчастью :(
Вопрос № 1 этой библиотеки о недоступности веб-сайта . Ему больше года. Я подозреваю, что эта библиотека довольно мертва.
Не исправляет, что он все еще где-то блокирует поток.
перенаправленная ссылка, которая указывает на более свежую реализацию, находится здесь: oracle.com/goto/java-async-db

johnlon · Accepted Answer · 2011-09-30T22-36-00.000Z

Я не понимаю, как какой-либо из предложенных подходов, которые обертывают вызовы JDBC в Актеры, исполнители или что-то еще, может помочь здесь - может кто-то уточнить.

Несомненно, основная проблема заключается в том, что блок операций JDBC в сокете IO. Когда он делает это, он блокирует поток, который работает на конце истории. Какую бы фреймворческую оболочку вы не решили использовать, чтобы в конечном итоге один поток был занят/заблокирован на один параллельный запрос.

Если базовые драйверы базы данных (MySql?) предлагают средство для перехвата создания сокета (см. SocketFactory), то я предполагаю, что можно было бы создать слой базы данных, основанный на async-событий, поверх api JDBC, но мы бы чтобы инкапсулировать весь JDBC за фасад, управляемый событиями, и этот фасад не будет похож на JDBC (после того, как он будет управляться событиями). Обработка базы данных будет происходить как асинхронный для другого потока для вызывающего, и вам нужно будет разработать, как создать диспетчер транзакций, который не полагается на сходство потоков.

Что-то вроде подхода, о котором я упоминал, позволит даже одному фоновому потоку обрабатывать нагрузку параллельных JDBC-exec. На практике вы, вероятно, запускаете пул потоков, чтобы использовать несколько ядер.

(Конечно, я не комментирую логику исходного вопроса только ответы, которые подразумевают, что concurrency в сценарии с блокирующим сокером IO возможен без пользователя шаблона селектора - проще просто выработать свой типичный JDBC concurrency и добавьте пул соединений нужного размера).

Похоже, что MySql, вероятно, делает что-то по строкам, которые я предлагаю --- http://code.google.com/p/async-mysql-connector/wiki/UsageExample

Это должно быть помечено как правильный ответ.
Использование Akka не делает вызовы реляционных БД асинхронными. Это позволяет вам легко запускать их на нескольких выделенных потоках для доступа к БД. Таким образом, вы не отключаете весь сайт, когда он перестает отвечать на запросы, потому что вы всегда выполняли асинхронные вызовы на уровне обслуживания для уровня DAO с обещаниями, а потоки вашего веб-сервера отделены от остальной части вашего приложения.
Актеры - не единственные обходные пути (например, микро-сервисы и асинхронное http, которые мы масштабируем до тысяч в секунду), и я не буду так быстро отклонять их как не асинхронные с точки зрения клиента. Если трафик потоков 1k UI поступает в вашу систему, и только 10 потоков блокируются в БД, тогда как 990 «сообщений» (или что-то подобное) помещаются в очередь в памяти без блокировки каких-либо потоков 1k UI (которые, вероятно, будут освобождены). .. разве это не то, что требуется? Мне бы очень хотелось увидеть истинный асинхронный JDBC, но это не значит, что пока что нет очень жизнеспособных обходных путей.