SQL Server：PARTITION BY和GROUP BY之间的区别

作者: v-star*위위
发布时间: 2024-01-17 08:45:28 (5月前)
转自：

11 条回复

0#
回复此人
一生流水 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 它提供汇总数据而不会卷起来 </p> <P> 即假设我想要返回销售区域的相对位置 </p> <P> 使用PARTITION BY，我可以返回给定区域的销售额的<strong> 和 </强> 同一行中所有销售区域的最大金额。 </p> <P> 这意味着您将拥有重复数据，但它可能适合最终消费者，因为数据已经聚合但没有数据丢失 - 就像GROUP BY的情况一样。 </p> </DIV>

编辑
1#
回复此人
苞米地里的蒙面妖 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> <code> partition by </code> 实际上并没有汇总数据。它允许您基于每个组重置某些内容。例如，您可以通过在分组字段上进行分区并使用来获取组内的序数列 <code> rownum() </code> 在该组内的行。这会给你一些行为有点像标识列的东西，它会在每个组的开头重置。 </p> </DIV>

编辑
2#
回复此人
雨儿 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 小观察。使用'partition by'动态生成SQL的自动化机制相对于'group by'实现起来要简单得多。在“分组依据”的情况下，我们必须注意“选择”列的内容。 </p> <P> 对不起我的英语不好。 </p> </DIV>

编辑
3#
回复此人
永远的记忆 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 假设我们有14条记录 <code> name </code> 表中的列 </p> <P> 在 <code> group by </code> </p> <pre> <code> select name,count(*) as totalcount from person where name='Please fill out' group BY name; </code> </pre> <P> 它将以单行计数，即14 </p> <P> 但在 <code> partition by </code> </p> <pre> <code> select row_number() over (partition by name) as total from person where name = 'Please fill out'; </code> </pre> <P> 它将增加14行计数 </p> </DIV>

编辑
4#
回复此人
记忆短浅♡思念不变 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 它们被用在不同的地方。 <code> group by </code> 修改整个查询，如： </p> <pre> <code> select customerId, count(*) as orderCount from Orders group by customerId </code> </pre> <P> 但 <code> partition by </code> 只是努力 <a href="https://en.wikipedia.org/wiki/Select_(SQL)#ROW_NUMBER()_window_function" rel="noreferrer"> 一个窗口功能 </A> ，喜欢 <code> row_number </code> ： </p> <pre> <code> select row_number() over (partition by customerId order by orderId) as OrderNumberForThisCustomer from Orders </code> </pre> <P> 一个 <code> group by </code> 通常会通过滚动它们并计算每行的平均值或总和来减少返回的行数。 <code> partition by </code> 不会影响返回的行数，但会改变计算窗口函数结果的方式。 </p> </DIV>

编辑
5#
回复此人
产品你是狗 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 我们可以举一个简单的例子 </p> <P> 我们有一个名为的表 <code> TableA </code> 具有以下值。 </p> <pre> <code> id firstname lastname Mark ------------------------------------------------------------------- 1 arun prasanth 40 2 ann antony 45 3 sruthy abc 41 6 new abc 47 1 arun prasanth 45 1 arun prasanth 49 2 ann antony 49 </code> </pre> <P> 的<strong> 通过...分组 </强> </p> <BLOCKQUOTE> <P> 可以在SELECT语句中使用SQL GROUP BY子句进行收集跨多个记录的数据，并将结果分组一个或多个列。 </p> <P> 换句话说，GROUP BY语句与结合使用聚合函数将结果集分组为一个或多个列。 </p> </BLOCKQUOTE> <P> 的<strong> 句法： </强> </p> <pre> <code> SELECT expression1, expression2, ... expression_n, aggregate_function (aggregate_expression) FROM tables WHERE conditions GROUP BY expression1, expression2, ... expression_n; </code> </pre> <P> 我们可以在表格中应用GroupBy </p> <pre> <code> select SUM(Mark)marksum,firstname from TableA group by id,firstName </code> </pre> <P> 结果： </p> <pre> <code> marksum firstname ---------------- 94 ann 134 arun 47 new 41 sruthy </code> </pre> <P> 在我们的实际表中，我们有7行，当我们按ID应用group时，服务器根据id对结果进行分组 </p> <P> 简单来说 </p> <BLOCKQUOTE> <P> 这里group by通常会减少滚动返回的行数他们起来并计算每一行的总和。 </p> </BLOCKQUOTE> <P> 的<strong> 分区 </强> </p> <P> 在去分区之前 </p> <P> 让我们看看OVER条款 </p> <P> 的<strong> 根据MSDN定义 </强> </p> <BLOCKQUOTE> <P> OVER子句定义一个窗口或用户指定的行集查询结果集。然后，窗口函数计算每行的值在窗口。您可以将OVER子句与函数一起使用来计算汇总值，如移动平均线，累计总量，运行总计，或每组结果的前N个。 </p> </BLOCKQUOTE> <P> <EM> partition by不会减少返回的行数 </EM> </p> <P> 我们可以在示例表中应用分区 </p> <pre> <code> select SUM(Mark) OVER (PARTITION BY id) AS marksum, firstname from TableA </code> </pre> <P> 结果： </p> <pre> <code> marksum firstname ------------------- 134 arun 134 arun 134 arun 94 ann 94 ann 41 sruthy 47 new </code> </pre> <P> 看看它会对行进行分区的结果，并导致所有行都不像group by。 </p> </DIV>

编辑
6#
回复此人
拥有小太阳的向日葵 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <BLOCKQUOTE> <P> 分区将结果集划分为分区。窗口函数分别应用于每个分区，并为每个分区重新开始计算。 </p> </BLOCKQUOTE> <P> 在此链接中找到： <a href="http://msdn.microsoft.com/en-us/library/ms189461.aspx" rel="noreferrer"> 超越条款 </A> </p> </DIV>

编辑
7#
回复此人
CTO啊哦 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 据我所知，Partition By几乎与Group By相同，但有以下不同之处： </p> <P> 该组实际上对结果集进行分组，每组返回一行，这导致SQL Server只允许在SELECT列表中允许聚合函数或属于group by子句的列（在这种情况下，SQL Server可以保证有唯一的每组的结果）。 </p> <P> 考虑例如MySQL允许在SELECT列表中具有未在Group By子句中定义的列，在这种情况下，每个组仍然返回一行，但是如果列没有唯一结果，则无法保证什么是输出！ </p> <P> 但是使用Partition By，虽然函数的结果与Group By的聚合函数的结果相同，但仍然得到正常的结果集，这意味着每个底层行获得一行，而不是每行一行group，因此，SELECT列表中的每个组都可以包含不唯一的列。 </p> <P> 因此，作为摘要，当需要每组输出一行时，分组依据是最佳的，当需要所有行但仍希望基于组的聚合函数时，分区依据是最佳的。 </p> <P> 当然也可能存在性能问题，请参阅 <a href="http://social.msdn.microsoft.com/Forums/ms-MY/transactsql/thread/0b20c2b5-1607-40bc-b7a7-0c60a2a55fba" rel="noreferrer"> http://social.msdn.microsoft.com/Forums/ms-MY/transactsql/thread/0b20c2b5-1607-40bc-b7a7-0c60a2a55fba </A> 。 </p> </DIV>

编辑
8#
回复此人
Innate Mind | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <pre> <code> -- BELOW IS A SAMPLE WHICH OUTLINES THE SIMPLE DIFFERENCES -- READ IT AND THEN EXECUTE IT -- THERE ARE THREE ROWS OF EACH COLOR INSERTED INTO THE TABLE -- CREATE A database called testDB -- use testDB USE [TestDB] GO -- create Paints table CREATE TABLE [dbo].[Paints]( [Color] [varchar](50) NULL, [glossLevel] [varchar](50) NULL ) ON [PRIMARY] GO -- Populate Table insert into paints (color, glossLevel) select 'red', 'eggshell' union select 'red', 'glossy' union select 'red', 'flat' union select 'blue', 'eggshell' union select 'blue', 'glossy' union select 'blue', 'flat' union select 'orange', 'glossy' union select 'orange', 'flat' union select 'orange', 'eggshell' union select 'green', 'eggshell' union select 'green', 'glossy' union select 'green', 'flat' union select 'black', 'eggshell' union select 'black', 'glossy' union select 'black', 'flat' union select 'purple', 'eggshell' union select 'purple', 'glossy' union select 'purple', 'flat' union select 'salmon', 'eggshell' union select 'salmon', 'glossy' union select 'salmon', 'flat' /* COMPARE 'GROUP BY' color to 'OVER (PARTITION BY Color)' */ -- GROUP BY Color -- row quantity defined by group by -- aggregate (count(*)) defined by group by select count(*) from paints group by color -- OVER (PARTITION BY... Color -- row quantity defined by main query -- aggregate defined by OVER-PARTITION BY select color , glossLevel , count(*) OVER (Partition by color) from paints /* COMPARE 'GROUP BY' color, glossLevel to 'OVER (PARTITION BY Color, GlossLevel)' */ -- GROUP BY Color, GlossLevel -- row quantity defined by GROUP BY -- aggregate (count(*)) defined by GROUP BY select count(*) from paints group by color, glossLevel -- Partition by Color, GlossLevel -- row quantity defined by main query -- aggregate (count(*)) defined by OVER-PARTITION BY select color , glossLevel , count(*) OVER (Partition by color, glossLevel) from paints </code> </pre> </DIV>

编辑
9#
回复此人
Charizard | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> <code> PARTITION BY </code> 是分析的，而 <code> GROUP BY </code> 是聚合的。为了使用 <code> PARTITION BY </code> ，你必须包含它 <a href="http://msdn.microsoft.com/en-us/library/ms189461.aspx" rel="noreferrer"> OVER条款 </A> 。 </p> </DIV>

编辑

登录后才能参与评论