Высокопроизводительный веб-сервер без интерактивности базы данных

Question 1

Вы хотите выполнить 6-7 миллионов операций записи в CSV-файл в деньчас?

Серьезно, база данных — это лучшая идея. База данных предназначена для обработки параллельных записей и может масштабироваться вертикально (большая машина, более быстрые диски) или горизонтально (распределение нагрузки на несколько серверов). Запись в один CSV-файл (илилюбойfile) требует некоторой формы блокировки для решения проблем параллелизма и плохо масштабируется по мере увеличения нагрузки ввода-вывода и параллелизма.

Чтобы обойти это, вам, вероятно, придется реализовать собственные уровни кэширования и буферизации, а затем начать распределять нагрузку между несколькими файлами и т. д. и т. п. Используйте какой-либо тип базы данных с самого начала и избавьте себя от множества проблем.

Answer

Вы хотите выполнить 6-7 миллионов операций записи в CSV-файл в деньчас?

Серьезно, база данных — это лучшая идея. База данных предназначена для обработки параллельных записей и может масштабироваться вертикально (большая машина, более быстрые диски) или горизонтально (распределение нагрузки на несколько серверов). Запись в один CSV-файл (илилюбойfile) требует некоторой формы блокировки для решения проблем параллелизма и плохо масштабируется по мере увеличения нагрузки ввода-вывода и параллелизма.

Чтобы обойти это, вам, вероятно, придется реализовать собственные уровни кэширования и буферизации, а затем начать распределять нагрузку между несколькими файлами и т. д. и т. п. Используйте какой-либо тип базы данных с самого начала и избавьте себя от множества проблем.

Question 2

Учитывая, что вы собираетесь делать около 2000 запросов/сек или 500 мкс/запрос наСРЕДНИЙ(то есть пики гораздо выше), CSV, вероятно, не подойдут из-за затирания записей при параллельных записях, поскольку ничто не гарантирует атомарную запись в ваших файлах.

Одна идея — файлы per-process/per-writer, которые собираются позже, другая идея — использовать базу данных, сильно настроенную на большие объемы записей. Вы также можете взглянуть на очереди сообщений или протоколы групповой связи (например,Распространение), но я не знаю, готовы ли они к такому объему.

Что бы вы ни делали, набросайте несколько быстрых идей и протестируйте их. Текущее оборудование может творить чудеса с производительностью, оптимизируйте только при необходимости. Что касается PHP — убедитесь, что у вас установлен Opcode Cache (например,БТР), в противном случае вы потратите много циклов на ненужную перекомпиляцию скриптов.

Также имейте в виду, как выглядит рост сервиса: вряд ли имеет смысл стремиться к решению, которое будет перегружено через несколько месяцев.

Answer

Учитывая, что вы собираетесь делать около 2000 запросов/сек или 500 мкс/запрос наСРЕДНИЙ(то есть пики гораздо выше), CSV, вероятно, не подойдут из-за затирания записей при параллельных записях, поскольку ничто не гарантирует атомарную запись в ваших файлах.

Одна идея — файлы per-process/per-writer, которые собираются позже, другая идея — использовать базу данных, сильно настроенную на большие объемы записей. Вы также можете взглянуть на очереди сообщений или протоколы групповой связи (например,Распространение), но я не знаю, готовы ли они к такому объему.

Что бы вы ни делали, набросайте несколько быстрых идей и протестируйте их. Текущее оборудование может творить чудеса с производительностью, оптимизируйте только при необходимости. Что касается PHP — убедитесь, что у вас установлен Opcode Cache (например,БТР), в противном случае вы потратите много циклов на ненужную перекомпиляцию скриптов.

Также имейте в виду, как выглядит рост сервиса: вряд ли имеет смысл стремиться к решению, которое будет перегружено через несколько месяцев.

Question 3

Какие параметры передаются через запрос GET? Должен ли он быть в CSV/базе данных в реальном времени? Или вы думаете, что можно создать фиктивный файл HTML (или PHP) и просто использовать веб-логи для анализа и выгрузки в CSV позже в качестве пакетного задания? (ладно... это звучит запутанно... но легко в обработке)...

Answer

Какие параметры передаются через запрос GET? Должен ли он быть в CSV/базе данных в реальном времени? Или вы думаете, что можно создать фиктивный файл HTML (или PHP) и просто использовать веб-логи для анализа и выгрузки в CSV позже в качестве пакетного задания? (ладно... это звучит запутанно... но легко в обработке)...

Question 4

Я бы посмотрел на server 2008 web edition и использовал ADO.net для записи в CSV-файл. У вас не должно быть проблем с пропускной способностью, так как ado.net будет буферизировать записи.

Answer

Я бы посмотрел на server 2008 web edition и использовал ADO.net для записи в CSV-файл. У вас не должно быть проблем с пропускной способностью, так как ado.net будет буферизировать записи.

Высокопроизводительный веб-сервер без интерактивности базы данных

решение1

решение2

решение3

решение4

Связанный контент