Size: a a a

DBA - русскоговорящее сообщество

2021 April 27

Y

YWNWA in DBA - русскоговорящее сообщество
Не знаю, в проекте так, я лишь придержался конвенций) этот параметр влияе на сокращение милисекунд вроде
источник
2021 April 28

НС

Наталья Светлова... in DBA - русскоговорящее сообщество
Здравствуйте, подскажите как сделать данный запрос.
Даны 2 CSV-файла с логами, значения в которых разделены символами "," или ";".
В 1-ом файле в каждой строке выводится 5 атрибутов: дата и время; IP-адрес пользователя; URL страницы, с которой зашел; URL страницы, на которую зашел.
Во 2-ом - в каждой строке 3 атрибута: IP-aдрес пользователя, наименование используемого браузера, наименование используемой ОС.
Необходимо считать данные из этих файлов и записать в базу данных MySQL.
Затем с помощью одного запроса вывести в HTML таблицу с полями: IP-адрес, браузер, ОС, URL с которого зашел первый раз, URL на который зашел последний раз, количество просмотренных уникальных URL-адресов, время, прошедшее с первого до последнего входа.
Я пишу, получается бред потому что вывод любых столбцов добавление в агрегирующую функцию.Но может как то по другому можно?
select   table1.ip, table2.name_browser, table2.name_os, COUNT(DISTINCT table1.url_with_in)
FROM table1, table2 where table1.ip=table2.ip
GROUP by table2.ip, table2.name_browser, table2.name_os;
Вижу вариант только сделать с подзапросами, но этот вариант вроде не очень.Хотя бы дайте наводку я по гуглю...
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Сначала запиши в БД в виде двух таблиц, потом уже унутре MySQL обрабатывай.
источник

НС

Наталья Светлова... in DBA - русскоговорящее сообщество
так я и записала в 2 таблицы table1  и table2
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
По факту-то данные -то ненормализованые... нет понятия сеанса, в рамках которого пользователь заходил.

Ну или можно это назвать конфигурацией клиента WEB. Ведь пользователь может с одного IP заходить с разных сочетаний OS/browser...

А у тебя если ты сделаешь JOIN по IP будут дубликаты данных из 1ой таблицы.
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Научись сообщения как следует оформлять, читать же невозможно...

select table1.ip, table2.name_browser, table2.name_os, COUNT(DISTINCT table1.url_with_in)
FROM table1
JOIN table2 on table1.ip=table2.ip
GROUP by table2.ip, table2.name_browser, table2.name_os;
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Так В ЧЁМ ПРОБЛЕМА ещё раз? Запрос, в принципе, верный. Кроме того, что COUNT тут не нужен совсем, и GROUP BY не поможет.
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Зачем COUNT влепила?
источник

НС

Наталья Светлова... in DBA - русскоговорящее сообщество
я думала об этом несколько раз, тогда должна третья таблица где будет первичный ключ, и две колонки id c внешними ключами на таблицы table1 , table2.
источник

СА

Сергей Антропов... in DBA - русскоговорящее сообщество
Коллеги, всем привет. Назрел такой вопрос. Он, конечно нубский, но все же.

Имеем standalone postgres10. Имеем свежий кластер postgres.
Останавливать standalone никак нельзя.
Нужно перелить данные из standalone в кластер.
Есть ли что-то, что позволит перелить данные «на лету», без pgdum/restore?
База очень большая. На несколько десятков Тб.
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
ДОлжна быть таблица- "Конфигурация клиента"
С примерно такими полями

web_config_id, client_os, client_browser

и в таблице 1 твоей должна быть ссылка на web_config_id , но ты это не сделаешь , это надо было делать при формировании этих данных
источник

НС

Наталья Светлова... in DBA - русскоговорящее сообщество
в том что нужно вывести URL на который зашел последний раз, время, прошедшее с первого до последнего входа.Он выводит только  IP-адрес, браузер, ОС,  количество просмотренных уникальных URL-адресов
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Да практически нет шансов, ещё и эти "первый раз— последний раз"...
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Ты даже если это напишешь, будет дерьмо а не запрос. Работать не будет быстро
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
IP-адрес, браузер, ОС, URL первый раз, URL на раз, количество просмотренных уникальных URL-адресов, время с первого до последнего входа

Тут ещё один момент — НЕТ В ДАННЫХ ПОЛЬЗОВАТЕЛЯ — IP — это НЕ пользователь.
Соответственно, тебе выделять пользовательский "сеанс" (от первого до последнего) не из чего.
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Так что шли того, кто дал задание, в жопу. Пусть данные готовит как следует.
источник

YS

Yaroslav Schekin in DBA - русскоговорящее сообщество
Лучше сразу перейти с этим вопросом в https://t.me/pgsql , IMHO.
источник

СА

Сергей Антропов... in DBA - русскоговорящее сообщество
Грац. Пойду туда
источник

НС

Наталья Светлова... in DBA - русскоговорящее сообщество
хм, да я с таким вопросам уже подходила почему нет данных😂 это с тестового задания на стажировку
источник

IZ

Ilia Zviagin in DBA - русскоговорящее сообщество
Меняй стажирующего...
источник