Лучший способ реализовать Group_by?

Question

Лучший способ реализовать Group_by?

1

Во множестве функциональных языков (python, ruby,...) или SQL мы можем напрямую использовать функцию Group_by (метод). Мой вопрос: если я хочу реализовать эту функцию (например, используя Java, C,.., которые не имеют "group_by", реализованных по умолчанию), что было бы лучшим способом сделать это? Следующая идея - общая идея подхода, любая идея лучше, чем эта?

Input: [ Key, Value ]
{ [ 'A', 1 ], [ 'B', 3 ], [ 'C', 1 ], [ 'A', 2 ], [ 'A', 6 ], [ 'B', 7 ] ... ... ... }

Output:
{ [ 'A', [ 1, 2, 6 ] ], [ 'B', [ 3, 7 ] ], [ 'C' [ 1 ] ], ... ... }

for element in "input": 
        for temp in "input":
            if ( temp.key == element.key )
                Output . getKey( element.key ) . addValue( temp.value );
            end if
        end for
end for

кроме того, пусть предполагается, что массив не отсортирован, и пусть предположим, что мы не сортируем его сначала (сначала сортировать его было бы очень просто).
Спасибо за это. Мы всегда можем сортировать его в первую очередь. Это один из способов сделать это. Кроме того, иногда это требует НЕ модифицировать ввод, что бы вы сделали? (копировать все входные данные было бы одним из решений, которое стоило бы много памяти)
Спасибо за то, что хэш-таблица также может решить эту проблему. Я считаю, что это самый распространенный способ сделать это. O (n) и сложность времени выполнения O (n).

(Я только демонстрирую идею в приведенном выше коде, не рассматриваю все детали)

Спасибо за ваш вдумчивый ответ!

user3284318 08 май 2014, в 09:21

Источник

0

Ваши входные объекты / структуры или массивы или хеш-карты?
Artjom B. 08 май 2014, в 06:41
0

Я не совсем уверен, что вы собираетесь здесь, но из ввода / вывода, я не думаю, что группа по функциям существует в Python - вам придется реализовать это самостоятельно, вероятно, используя defaultdict(list) - возможно, именно так я и реализовал бы это на других языках. - Какие-то значения отображения хеш-таблиц в какую-то структуру списка, которая поддерживает добавление.
mgilson 08 май 2014, в 06:41
0

@ Artjom B. Не имеет значения структура массива или хэш-функции. Давайте предположим, что это массив (2d массив)
user3284318 08 май 2014, в 06:47
0

@ mgilson Я согласен. это вероятно не существует в питоне. Но идея, которую я здесь перечислил, заключается в том, что в python есть очень красивые вспомогательные функции для обработки списков, кортежей, ... что означает, что очень легко просто расширить его. Идея здесь в том, чтобы просто попытаться обсудить снизу, без какой-либо вспомогательной функции для достижения этой цели. Спасибо
user3284318 08 май 2014, в 06:50

Показать ещё 2 комментария

Теги:

python

sql

ruby-on-rails

algorithm

data-structures

2 ответа

Ещё вопросы

Ваши входные объекты / структуры или массивы или хеш-карты?
Я не совсем уверен, что вы собираетесь здесь, но из ввода / вывода, я не думаю, что группа по функциям существует в Python - вам придется реализовать это самостоятельно, вероятно, используя defaultdict(list) - возможно, именно так я и реализовал бы это на других языках. - Какие-то значения отображения хеш-таблиц в какую-то структуру списка, которая поддерживает добавление.
@ Artjom B. Не имеет значения структура массива или хэш-функции. Давайте предположим, что это массив (2d массив)
@ mgilson Я согласен. это вероятно не существует в питоне. Но идея, которую я здесь перечислил, заключается в том, что в python есть очень красивые вспомогательные функции для обработки списков, кортежей, ... что означает, что очень легко просто расширить его. Идея здесь в том, чтобы просто попытаться обсудить снизу, без какой-либо вспомогательной функции для достижения этой цели. Спасибо

Nafeez Abrar · Answer 1 · 2014-05-08T07-12-00.000Z

В python вы можете использовать dictioanry

input = [('A', 1), ('B', 3), ('C', 1), ('A', 2), ('A', 6), ('B', 7)]

output = {}
for key, value in input:
    if not key in output:
        output[key] = []
    output[key].append(value)

благодарю вас. Ваш метод зависит от списка в Python имеет функцию хэш-таблицы. Без хеш-таблицы логика фактически такая же, как у меня. Но спасибо за указание на это.

Ruby Racer · Answer 2 · 2014-05-08T05-24-00.000Z

Не рассматривайте это как ответ, а как комментарий. Дело в том, что я не могу отправлять комментарии в комментариях.

Общим подходом было бы это (легко адаптируемое практически к любому языку), если я правильно понял ваш вопрос:

питон:

def group_by(arr):
    arr.sort()
    newarr=[]
    temparr=[]
    k=""
    for i in arr:
        if i[0]!=k:
            if len(temparr)>0:
                newarr.append([k,temparr]) # newarr = newarr + [k, temparr] also works
            k=i[0]
            temparr=[i[1]]
        else:
            temparr.append(i[1])
    newarr.append([k,temparr])
    print(newarr)

Спасибо. Это один из способов сделать это - Сортировка. Спасибо за указание на это. Кроме того, я могу спросить, если вход не позволяет изменить. Чтобы ты делал? (Я согласен, копировать все данные - это один из способов сделать это, но тратить впустую столько памяти)
Извините, я не совсем понимаю. Что вы имеете в виду "вход не может изменить"?
Я имею в виду, входные данные не позволяют редактировать (неизменяемые).
Почему у вас есть неизменный список? В этом случае вы запускаете перенос item_by_item в новый список. newlist = [], для i в arr: newlist.append (i) // newlist.sort () и работа с ним