사전 목록이 있으며 각 항목을 특정 속성 값별로 정렬하려고합니다.
다음 배열을 고려하십시오.
[{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
name
으로 정렬하면 될 것입니다.
[{'name':'Bart', 'age':10}, {'name':'Homer', 'age':39}]
Cmp 대신 키를 사용하여 더 깨끗하게 보일 수 있습니다.
newlist = sorted(list_to_be_sorted, key=lambda k: k['name'])
또는 J.F.Sebastian과 다른 사람들이 제안한 것처럼,
from operator import itemgetter
newlist = sorted(list_to_be_sorted, key=itemgetter('name'))
완성을 위해 (fitzgeraldsteele의 주석에서 지적한대로) reverse=True
를 추가하여 내림차순 정렬
newlist = sorted(l, key=itemgetter('name'), reverse=True)
import operator
Key = 'name'에 의해 사전 목록을 정렬하려면,
list_of_dicts.sort(key=operator.itemgetter('name'))
사전 목록을 key = 'age'로 정렬하려면,
list_of_dicts.sort(key=operator.itemgetter('age'))
여러 키를 사용하여 목록을 정렬하려면 다음을 수행 할 수 있습니다.
my_list = [{'name':'Homer', 'age':39}, {'name':'Milhouse', 'age':10}, {'name':'Bart', 'age':10} ]
sortedlist = sorted(my_list , key=lambda elem: "%02d %s" % (elem['age'], elem['name']))
비교하기 위해 값을 단일 문자열 표현으로 변환해야하기 때문에 hackish이지만 숫자가 음수 인 경우에는 예상대로 작동합니다 (숫자를 사용하는 경우 문자열을 숫자 0으로 적절하게 형식화해야 함)
my_list = [{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
my_list.sort(lambda x,y : cmp(x['name'], y['name']))
my_list
가 이제 원하는대로됩니다.
(3 년 후) 추가 편집 :
새 key
인수가 더 효율적이고 깔끔합니다. 더 나은 대답은 다음과 같습니다.
my_list = sorted(my_list, key=lambda k: k['name'])
... 람다는 IMO이며 operator.itemgetter
보다 이해하기 쉽지만 YMMV는 있습니다.
import operator
a_list_of_dicts.sort(key=operator.itemgetter('name'))
'key'는 임의의 값으로 정렬하기 위해 사용되며 'itemgetter'는 각 항목의 'name'속성에 해당 값을 설정합니다.
당신이 의미 한 것 같아요.
[{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
이것은 다음과 같이 정렬됩니다.
sorted(l,cmp=lambda x,y: cmp(x['name'],y['name']))
Perl에서 Schwartzian 변환을 사용하여,
py = [{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
해야 할 것
sort_on = "name"
decorated = [(dict_[sort_on], dict_) for dict_ in py]
decorated.sort()
result = [dict_ for (key, dict_) in decorated]
주는
>>> result
[{'age': 10, 'name': 'Bart'}, {'age': 39, 'name': 'Homer'}]
컴퓨터 과학에서 Schwartzian 변환은 항목 목록을 정렬하는 효율을 높이기 위해 사용되는 Perl 프로그래밍 관용구입니다. 이 관용구는 순서를 요소의 특정 속성 (키)의 순서에 따라 실제로 비교할 때 정렬에 적합합니다. 최소한의 횟수로 수행되어야하는 집중적 인 작업. Schwartzian 변형은 명명 된 임시 배열을 사용하지 않는다는 점에서 주목할 만합니다.
a = [{'name':'Homer', 'age':39}, ...]
# This changes the list a
a.sort(key=lambda k : k['name'])
# This returns a new list (a is not modified)
sorted(a, key=lambda k : k['name'])
사용자 지정 비교 함수를 사용하거나 사용자 지정 정렬 키를 계산하는 함수를 전달할 수 있습니다. 이는 일반적으로 키가 항목 당 한 번만 계산되는 반면 비교 함수는 더 많이 호출되므로 더 효율적입니다.
당신은 이렇게 할 수 있습니다 :
def mykey(adict): return adict['name']
x = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age':10}]
sorted(x, key=mykey)
그러나 표준 라이브러리에는 임의의 객체 항목을 가져 오는 일반 루틴이 있습니다 : itemgetter
. 따라서 대신 다음을 시도하십시오.
from operator import itemgetter
x = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age':10}]
sorted(x, key=itemgetter('name'))
이름 키의 값으로 사전을 비교하는 자체 비교 함수를 구현해야합니다. PythonInfo Wiki에서 미니 하우투 정렬하기
나는 이런 것을 시도했다 :
my_list.sort(key=lambda x: x['name'])
그것은 정수에서도 잘 작동했습니다.
언젠가 예를 들어 lower()
을 사용해야 할 때가 있습니다.
lists = [{'name':'Homer', 'age':39},
{'name':'Bart', 'age':10},
{'name':'abby', 'age':9}]
lists = sorted(lists, key=lambda k: k['name'])
print(lists)
# [{'name':'Bart', 'age':10}, {'name':'Homer', 'age':39}, {'name':'abby', 'age':9}]
lists = sorted(lists, key=lambda k: k['name'].lower())
print(lists)
# [ {'name':'abby', 'age':9}, {'name':'Bart', 'age':10}, {'name':'Homer', 'age':39}]
다음은 대안적인 일반적인 해결책입니다 - 키와 값으로 dict 요소를 정렬합니다. 장점은 키를 지정할 필요가 없으며 일부 키가 일부 사전에없는 경우에도 작동합니다.
def sort_key_func(item):
""" helper function used to sort list of dicts
:param item: dict
:return: sorted list of tuples (k, v)
"""
pairs = []
for k, v in item.items():
pairs.append((k, v))
return sorted(pairs)
sorted(A, key=sort_key_func)
Pandas 패키지를 사용하는 것은 또 다른 방법입니다. 대규모 런타임은 다른 사람들이 제안한 전통적인 방법보다 훨씬 느립니다.
import pandas as pd
listOfDicts = [{'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}]
df = pd.DataFrame(listOfDicts)
df = df.sort_values('name')
sorted_listOfDicts = df.T.to_dict().values()
다음은 작은 목록과 큰 (100k +) dicts 목록에 대한 벤치 마크 값입니다.
setup_large = "listOfDicts = [];\
[listOfDicts.extend(({'name':'Homer', 'age':39}, {'name':'Bart', 'age':10})) for _ in range(50000)];\
from operator import itemgetter;import pandas as pd;\
df = pd.DataFrame(listOfDicts);"
setup_small = "listOfDicts = [];\
listOfDicts.extend(({'name':'Homer', 'age':39}, {'name':'Bart', 'age':10}));\
from operator import itemgetter;import pandas as pd;\
df = pd.DataFrame(listOfDicts);"
method1 = "newlist = sorted(listOfDicts, key=lambda k: k['name'])"
method2 = "newlist = sorted(listOfDicts, key=itemgetter('name')) "
method3 = "df = df.sort_values('name');\
sorted_listOfDicts = df.T.to_dict().values()"
import timeit
t = timeit.Timer(method1, setup_small)
print('Small Method LC: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup_small)
print('Small Method LC2: ' + str(t.timeit(100)))
t = timeit.Timer(method3, setup_small)
print('Small Method Pandas: ' + str(t.timeit(100)))
t = timeit.Timer(method1, setup_large)
print('Large Method LC: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup_large)
print('Large Method LC2: ' + str(t.timeit(100)))
t = timeit.Timer(method3, setup_large)
print('Large Method Pandas: ' + str(t.timeit(1)))
#Small Method LC: 0.000163078308105
#Small Method LC2: 0.000134944915771
#Small Method Pandas: 0.0712950229645
#Large Method LC: 0.0321750640869
#Large Method LC2: 0.0206089019775
#Large Method Pandas: 5.81405615807
아래 요소들을 가지고 사전 D를 말해 보자. sort에서 정렬 된 key 인자를 정렬하기 위해서는 아래와 같이 custom 함수를 넘겨 주면됩니다.
D = {'eggs': 3, 'ham': 1, 'spam': 2}
def get_count(Tuple):
return Tuple[1]
sorted(D.items(), key = get_count, reverse=True)
or
sorted(D.items(), key = lambda x: x[1], reverse=True) avoiding get_count function call
여기에 여러 컬럼별로 정렬하는 것과 관련된 질문에 대한 나의 대답 . 또한 열의 수가 하나 인 퇴보 한 경우에도 작동합니다.
list
의 원래 dictionaries
이 필요하지 않은 경우 사용자 지정 키 함수를 사용하여 sort()
메서드로 해당 위치를 수정할 수 있습니다.
주요 기능 :
def get_name(d):
""" Return the value of a key in a dictionary. """
return d["name"]
정렬 할 list
:
data_one = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age': 10}]
전체 정렬 :
data_one.sort(key=get_name)
원래 list
이 필요한 경우 sorted()
함수를 호출하여 list
과 키 함수를 전달한 다음 반환 된 정렬 된 list
을 새 변수에 할당합니다.
data_two = [{'name': 'Homer', 'age': 39}, {'name': 'Bart', 'age': 10}]
new_data = sorted(data_two, key=get_name)
data_one
및 new_data
인쇄 중.
>>> print(data_one)
[{'name': 'Bart', 'age': 10}, {'name': 'Homer', 'age': 39}]
>>> print(new_data)
[{'name': 'Bart', 'age': 10}, {'name': 'Homer', 'age': 39}]
성능을 고려하려면 itemgetter 를 사용할 수 있습니다. itemgetter 는 일반적으로 lambda 보다 빠릅니다.
from operator import itemgetter
result = sorted(data, key=itemgetter('age')) # this will sort list by property order 'age'.
다음 코드를 사용할 수 있습니다.
sorted_dct = sorted(dct_name.items(), key = lambda x : x[1])