orleanz: (main)
[personal profile] orleanz
Уточняю вопрос (иначе он был бы бессмысленным)

Допустим, у нас есть 1 (одна) таблица с 2 (двумя) колонками

В первой колонке - большой интегер, Юникс тайм, отсортированный по возрастанию, во второй колонке - строки (собственно пейлоуд, данные)

Я хочу максимально быстро выдавать те строки таблицы, которые удолетворяют некому условию по первой колонке, например, все строки соответствующие одному дню

Это элементарно делается с использования условного Постгреса, ок.

Но ведь можно создать на файловой системе набор файлов, для каждого дня, где содержимое файла и будет набор строк с пейлоудом. И отдавать данные путем просто открытия файла с нужным именем (которое совпадает с днем, например, 2010.10.31.txt) и чтением данных из файла. Там и кэширование автомически появится, на уровне файловой системе, типа, бесплатный бонус.

Что будет в результате быстрее, как думаете?

Вопрос апдейта данных и сложных запросов не стоит, речь про узкоспециализированную задачу, описанную выше.

Тут ведь еще какой момент есть - если речь идет про веб, то выдача данных может идти НАПРЯМУЮ через стоящий впереди реверс-прокси Nginx, через статическую директорию. То есть просто по прямому УРЛ обращаешься к файлу с соответствующим именем, скажем, http://mysite.com/static/db/2010.10.31.txt, и усё, Энджинэкс выдаст данные даже не потревожив Ноду (аппликейшен сервер). А если делать через базу данных, то аппликейшен сервер будет по всякому задействован...

Date: 2016-02-25 09:02 am (UTC)
From: [identity profile] imfromjasenevo.livejournal.com
не программист, но мне кажется, что файлы должны быть быстреей на порядок, другое дело, что базы более надежно и больше гарантий, что данные не похерятся и структура не сломается, если что-то не так пойдет.

Date: 2016-02-25 09:54 am (UTC)
From: [identity profile] vit-r.livejournal.com
Зависит от кучи факторов. Тем более, что таблицы могут быть в памяти, а могут висеть в распределённой базе. В общем случае, накладные расходы на открытие файлов слишком большие.

Самое быстрое (в общем варианте) - это денормализовать таблицы добавить столбцов по характерным запросам ( например "день недели", "число", "месяц") и загнать всё в память.

То есть просто по прямому УРЛ обращаешься к файлу с соответствующим именем...

Угу. Так и хочется добавить в имя ../../../ и выйти на новый уровень.
Edited Date: 2016-02-25 09:55 am (UTC)

Date: 2016-02-25 10:36 am (UTC)
From: [identity profile] Сергей Монахов (from livejournal.com)
БД быстрее. Открытие файла с диска это очень медленно.

Date: 2016-02-25 01:00 pm (UTC)
From: [identity profile] p-a-s-h-a.livejournal.com
Может зависеть от количества одновременных обращений. При массовом обращении БД быстрее. При небольшом количестве может быть быстрее файловая система. Также ускорить могут навешанные сверху стандартных файловосистемных и БД-шных дополнительные кэшировщики...
Или умный админ, который заточит БД под идеальное кэширование :)

Date: 2016-02-25 05:45 pm (UTC)
From: [identity profile] sab123.livejournal.com
Я думаю файлы будут гораздо быстрее. БД - очень медленная штука.

Profile

orleanz: (Default)
orleanz

December 2018

S M T W T F S
      1
2345678
9101112 131415
16171819202122
23242526272829
3031     

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jun. 26th, 2025 10:35 am
Powered by Dreamwidth Studios