diff --git a/benchmark/pics/cpu_scatter.png b/benchmark/pics/cpu_scatter.png
new file mode 100644
index 000000000..d0729e7a6
Binary files /dev/null and b/benchmark/pics/cpu_scatter.png differ
diff --git a/benchmark/pics/cpu_scatter.svg b/benchmark/pics/cpu_scatter.svg
new file mode 100644
index 000000000..5f977c38d
--- /dev/null
+++ b/benchmark/pics/cpu_scatter.svg
@@ -0,0 +1,333 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<svg xmlns="http://www.w3.org/2000/svg"
+     xmlns:xlink="http://www.w3.org/1999/xlink"
+     xmlns:gadfly="http://www.gadflyjl.org/ns"
+     version="1.2"
+     width="228.6mm" height="152.4mm" viewBox="0 0 228.6 152.4"
+     stroke="none"
+     fill="#000000"
+     stroke-width="0.3"
+     font-size="3.88"
+>
+<defs>
+  <marker id="arrow" markerWidth="15" markerHeight="7" refX="5" refY="3.5" orient="auto" markerUnits="strokeWidth">
+    <path d="M0,0 L15,3.5 L0,7 z" stroke="context-stroke" fill="context-stroke"/>
+  </marker>
+</defs>
+<g class="plotroot xscalable yscalable" id="img-450cb06b-1">
+  <g font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" fill="#564A55" stroke="#000000" stroke-opacity="0.000" id="img-450cb06b-2">
+    <g transform="translate(110.57,140.79)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">Matrix Size</text>
+      </g>
+    </g>
+  </g>
+  <g class="guide xlabels" font-size="2.82" font-family="'PT Sans Caption','Helvetica Neue','Helvetica',sans-serif" fill="#6C606B" id="img-450cb06b-3">
+    <g transform="translate(32.1,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">5</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(84.41,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">10</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(136.73,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">15</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(189.05,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">20</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+  </g>
+  <g class="guide colorkey" id="img-450cb06b-4">
+    <g fill="#4C404B" font-size="2.82" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" id="img-450cb06b-5">
+      <g transform="translate(205.33,71.19)" id="img-450cb06b-6" class="color_geometricflux">
+        <g class="primitive">
+          <text dy="0.35em">geometricflux</text>
+        </g>
+      </g>
+      <g transform="translate(205.33,74.82)" id="img-450cb06b-7" class="color_pytorch-scatter">
+        <g class="primitive">
+          <text dy="0.35em">pytorch-scatter</text>
+        </g>
+      </g>
+    </g>
+    <g stroke="#000000" stroke-opacity="0.000" id="img-450cb06b-8">
+      <g transform="translate(203.42,71.19)" id="img-450cb06b-9" class="color_geometricflux" fill="#00BFFF">
+        <path d="M-0.91,-0.91 L 0.91 -0.91 0.91 0.91 -0.91 0.91 z" class="primitive"/>
+      </g>
+      <g transform="translate(203.42,74.82)" id="img-450cb06b-10" class="color_pytorch-scatter" fill="#D4CA3A">
+        <path d="M-0.91,-0.91 L 0.91 -0.91 0.91 0.91 -0.91 0.91 z" class="primitive"/>
+      </g>
+    </g>
+    <g fill="#362A35" font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" stroke="#000000" stroke-opacity="0.000" id="img-450cb06b-11">
+      <g transform="translate(202.51,67.37)" id="img-450cb06b-12">
+        <g class="primitive">
+          <text dy="-0em">framework</text>
+        </g>
+      </g>
+    </g>
+  </g>
+  <g clip-path="url(#img-450cb06b-13)">
+    <g id="img-450cb06b-14">
+      <g pointer-events="visible" fill="#000000" fill-opacity="0.000" stroke="#000000" stroke-opacity="0.000" class="guide background" id="img-450cb06b-15">
+        <g transform="translate(110.57,71.19)" id="img-450cb06b-16">
+          <path d="M-90.94,-60.58 L 90.94 -60.58 90.94 60.58 -90.94 60.58 z" class="primitive"/>
+        </g>
+      </g>
+      <g class="guide ygridlines xfixed" stroke-dasharray="0.5,0.5" stroke-width="0.2" stroke="#D0D0E0" id="img-450cb06b-17">
+        <g transform="translate(110.57,129.78)" id="img-450cb06b-18">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,110.25)" id="img-450cb06b-19">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,90.72)" id="img-450cb06b-20">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,71.19)" id="img-450cb06b-21">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,51.67)" id="img-450cb06b-22">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,32.14)" id="img-450cb06b-23">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,12.61)" id="img-450cb06b-24">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+      </g>
+      <g class="guide xgridlines yfixed" stroke-dasharray="0.5,0.5" stroke-width="0.2" stroke="#D0D0E0" id="img-450cb06b-25">
+        <g transform="translate(32.1,71.19)" id="img-450cb06b-26">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+        <g transform="translate(84.41,71.19)" id="img-450cb06b-27">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+        <g transform="translate(136.73,71.19)" id="img-450cb06b-28">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+        <g transform="translate(189.05,71.19)" id="img-450cb06b-29">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+      </g>
+      <g class="plotpanel" id="img-450cb06b-30">
+        <metadata>
+          <boundingbox value="19.63166666666669mm 10.611666666666665mm 181.88166666666666mm 121.16666666666664mm"/>
+          <unitbox value="3.8088616964461393 7.102418207681366 17.382276607107723 -6.204836415362731"/>
+        </metadata>
+        <g class="geometry" id="img-450cb06b-31">
+          <g stroke-width="0.3" id="img-450cb06b-32">
+            <g transform="translate(32.1,83.16)" id="img-450cb06b-33" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-30.9 L 0 30.9" class="primitive"/>
+            </g>
+            <g transform="translate(84.41,67.68)" id="img-450cb06b-34" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-21.75 L 0 21.75" class="primitive"/>
+            </g>
+            <g transform="translate(136.73,51.59)" id="img-450cb06b-35" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-8.08 L 0 8.08" class="primitive"/>
+            </g>
+            <g transform="translate(189.05,24.82)" id="img-450cb06b-36" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-1.11 L 0 1.11" class="primitive"/>
+            </g>
+            <g transform="translate(32.1,111.37)" id="img-450cb06b-37" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-7.6 L 0 7.6" class="primitive"/>
+            </g>
+            <g transform="translate(84.41,107.66)" id="img-450cb06b-38" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-4.96 L 0 4.96" class="primitive"/>
+            </g>
+            <g transform="translate(136.73,87.33)" id="img-450cb06b-39" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-1.83 L 0 1.83" class="primitive"/>
+            </g>
+            <g transform="translate(189.05,58.77)" id="img-450cb06b-40" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-0.25 L 0 0.25" class="primitive"/>
+            </g>
+            <g class="marker" id="img-450cb06b-41">
+              <g transform="translate(32.1,114.07)" id="img-450cb06b-42" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,89.44)" id="img-450cb06b-43" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,59.67)" id="img-450cb06b-44" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,25.93)" id="img-450cb06b-45" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(32.1,118.97)" id="img-450cb06b-46" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,112.62)" id="img-450cb06b-47" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,89.16)" id="img-450cb06b-48" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,59.01)" id="img-450cb06b-49" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+            </g>
+            <g class="marker" id="img-450cb06b-50">
+              <g transform="translate(32.1,52.26)" id="img-450cb06b-51" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,45.93)" id="img-450cb06b-52" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,43.5)" id="img-450cb06b-53" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,23.71)" id="img-450cb06b-54" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(32.1,103.77)" id="img-450cb06b-55" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,102.7)" id="img-450cb06b-56" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,85.51)" id="img-450cb06b-57" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,58.52)" id="img-450cb06b-58" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+            </g>
+          </g>
+        </g>
+        <g stroke-width="0.3" fill="#000000" fill-opacity="0.000" class="geometry" id="img-450cb06b-59">
+          <g transform="translate(110.57,67.57)" id="img-450cb06b-60" class="color_geometricflux" stroke-dasharray="none" stroke="#00BFFF">
+            <path fill="none" d="M-78.48,41.38 L -26.16 15.2 26.16 -13.75 78.48 -42.83" class="primitive"/>
+          </g>
+          <g transform="translate(110.57,94.58)" id="img-450cb06b-61" class="color_pytorch-scatter" stroke-dasharray="none" stroke="#D4CA3A">
+            <path fill="none" d="M-78.48,23.91 L -26.16 17.64 26.16 -5.87 78.48 -35.67" class="primitive"/>
+          </g>
+        </g>
+        <g class="geometry" id="img-450cb06b-62">
+          <g stroke-width="0.3" id="img-450cb06b-63">
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-450cb06b-64">
+              <g class="marker" id="img-450cb06b-65">
+                <g transform="translate(189.05,58.91)" id="img-450cb06b-66">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-450cb06b-67">
+              <g class="marker" id="img-450cb06b-68">
+                <g transform="translate(136.73,88.71)" id="img-450cb06b-69">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-450cb06b-70">
+              <g class="marker" id="img-450cb06b-71">
+                <g transform="translate(84.41,112.22)" id="img-450cb06b-72">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-450cb06b-73">
+              <g class="marker" id="img-450cb06b-74">
+                <g transform="translate(32.1,118.49)" id="img-450cb06b-75">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-450cb06b-76">
+              <g class="marker" id="img-450cb06b-77">
+                <g transform="translate(189.05,24.75)" id="img-450cb06b-78">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-450cb06b-79">
+              <g class="marker" id="img-450cb06b-80">
+                <g transform="translate(136.73,53.83)" id="img-450cb06b-81">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-450cb06b-82">
+              <g class="marker" id="img-450cb06b-83">
+                <g transform="translate(84.41,82.77)" id="img-450cb06b-84">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-450cb06b-85">
+              <g class="marker" id="img-450cb06b-86">
+                <g transform="translate(32.1,108.95)" id="img-450cb06b-87">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+          </g>
+        </g>
+      </g>
+    </g>
+  </g>
+  <g class="guide ylabels" font-size="2.82" font-family="'PT Sans Caption','Helvetica Neue','Helvetica',sans-serif" fill="#6C606B" id="img-450cb06b-88">
+    <g transform="translate(18.63,129.78)" id="img-450cb06b-89">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">1</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,110.25)" id="img-450cb06b-90">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">2</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,90.72)" id="img-450cb06b-91">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">3</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,71.19)" id="img-450cb06b-92">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">4</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,51.67)" id="img-450cb06b-93">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">5</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,32.14)" id="img-450cb06b-94">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">6</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,12.61)" id="img-450cb06b-95">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">7</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+  </g>
+  <g font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" fill="#564A55" stroke="#000000" stroke-opacity="0.000" id="img-450cb06b-96">
+    <g transform="translate(8.81,69.19)" id="img-450cb06b-97">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.35em" transform="rotate(-90,0, 2)">Time (μs)</text>
+      </g>
+    </g>
+  </g>
+  <g font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" fill="#564A55" stroke="#000000" stroke-opacity="0.000" id="img-450cb06b-98">
+    <g transform="translate(110.57,5)" id="img-450cb06b-99">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">Scatter add performance on CPU</text>
+      </g>
+    </g>
+  </g>
+</g>
+<defs>
+  <clipPath id="img-450cb06b-13">
+    <path d="M19.63,10.61 L 201.51 10.61 201.51 131.78 19.63 131.78" />
+  </clipPath>
+</defs>
+</svg>
diff --git a/benchmark/pics/gpu_scatter.png b/benchmark/pics/gpu_scatter.png
new file mode 100644
index 000000000..9129d1be0
Binary files /dev/null and b/benchmark/pics/gpu_scatter.png differ
diff --git a/benchmark/pics/gpu_scatter.svg b/benchmark/pics/gpu_scatter.svg
new file mode 100644
index 000000000..e8a317ab3
--- /dev/null
+++ b/benchmark/pics/gpu_scatter.svg
@@ -0,0 +1,325 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<svg xmlns="http://www.w3.org/2000/svg"
+     xmlns:xlink="http://www.w3.org/1999/xlink"
+     xmlns:gadfly="http://www.gadflyjl.org/ns"
+     version="1.2"
+     width="228.6mm" height="152.4mm" viewBox="0 0 228.6 152.4"
+     stroke="none"
+     fill="#000000"
+     stroke-width="0.3"
+     font-size="3.88"
+>
+<defs>
+  <marker id="arrow" markerWidth="15" markerHeight="7" refX="5" refY="3.5" orient="auto" markerUnits="strokeWidth">
+    <path d="M0,0 L15,3.5 L0,7 z" stroke="context-stroke" fill="context-stroke"/>
+  </marker>
+</defs>
+<g class="plotroot xscalable yscalable" id="img-850f8303-1">
+  <g font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" fill="#564A55" stroke="#000000" stroke-opacity="0.000" id="img-850f8303-2">
+    <g transform="translate(110.57,140.79)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">Matrix Size</text>
+      </g>
+    </g>
+  </g>
+  <g class="guide xlabels" font-size="2.82" font-family="'PT Sans Caption','Helvetica Neue','Helvetica',sans-serif" fill="#6C606B" id="img-850f8303-3">
+    <g transform="translate(32.1,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">5</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(84.41,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">10</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(136.73,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">15</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(189.05,132.78)">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">2<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">20</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+  </g>
+  <g class="guide colorkey" id="img-850f8303-4">
+    <g fill="#4C404B" font-size="2.82" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" id="img-850f8303-5">
+      <g transform="translate(205.33,71.19)" id="img-850f8303-6" class="color_geometricflux">
+        <g class="primitive">
+          <text dy="0.35em">geometricflux</text>
+        </g>
+      </g>
+      <g transform="translate(205.33,74.82)" id="img-850f8303-7" class="color_pytorch-scatter">
+        <g class="primitive">
+          <text dy="0.35em">pytorch-scatter</text>
+        </g>
+      </g>
+    </g>
+    <g stroke="#000000" stroke-opacity="0.000" id="img-850f8303-8">
+      <g transform="translate(203.42,71.19)" id="img-850f8303-9" class="color_geometricflux" fill="#00BFFF">
+        <path d="M-0.91,-0.91 L 0.91 -0.91 0.91 0.91 -0.91 0.91 z" class="primitive"/>
+      </g>
+      <g transform="translate(203.42,74.82)" id="img-850f8303-10" class="color_pytorch-scatter" fill="#D4CA3A">
+        <path d="M-0.91,-0.91 L 0.91 -0.91 0.91 0.91 -0.91 0.91 z" class="primitive"/>
+      </g>
+    </g>
+    <g fill="#362A35" font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" stroke="#000000" stroke-opacity="0.000" id="img-850f8303-11">
+      <g transform="translate(202.51,67.37)" id="img-850f8303-12">
+        <g class="primitive">
+          <text dy="-0em">framework</text>
+        </g>
+      </g>
+    </g>
+  </g>
+  <g clip-path="url(#img-850f8303-13)">
+    <g id="img-850f8303-14">
+      <g pointer-events="visible" fill="#000000" fill-opacity="0.000" stroke="#000000" stroke-opacity="0.000" class="guide background" id="img-850f8303-15">
+        <g transform="translate(110.57,71.19)" id="img-850f8303-16">
+          <path d="M-90.94,-60.58 L 90.94 -60.58 90.94 60.58 -90.94 60.58 z" class="primitive"/>
+        </g>
+      </g>
+      <g class="guide ygridlines xfixed" stroke-dasharray="0.5,0.5" stroke-width="0.2" stroke="#D0D0E0" id="img-850f8303-17">
+        <g transform="translate(110.57,129.78)" id="img-850f8303-18">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,106.34)" id="img-850f8303-19">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,82.91)" id="img-850f8303-20">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,59.48)" id="img-850f8303-21">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,36.04)" id="img-850f8303-22">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+        <g transform="translate(110.57,12.61)" id="img-850f8303-23">
+          <path fill="none" d="M-90.94,0 L 90.94 0" class="primitive"/>
+        </g>
+      </g>
+      <g class="guide xgridlines yfixed" stroke-dasharray="0.5,0.5" stroke-width="0.2" stroke="#D0D0E0" id="img-850f8303-24">
+        <g transform="translate(32.1,71.19)" id="img-850f8303-25">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+        <g transform="translate(84.41,71.19)" id="img-850f8303-26">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+        <g transform="translate(136.73,71.19)" id="img-850f8303-27">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+        <g transform="translate(189.05,71.19)" id="img-850f8303-28">
+          <path fill="none" d="M0,-60.58 L 0 60.58" class="primitive"/>
+        </g>
+      </g>
+      <g class="plotpanel" id="img-850f8303-29">
+        <metadata>
+          <boundingbox value="19.63166666666669mm 10.611666666666665mm 181.88166666666666mm 121.16666666666664mm"/>
+          <unitbox value="3.8088616964461393 5.085348506401138 17.382276607107723 -5.170697012802275"/>
+        </metadata>
+        <g class="geometry" id="img-850f8303-30">
+          <g stroke-width="0.3" id="img-850f8303-31">
+            <g transform="translate(32.1,91.23)" id="img-850f8303-32" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-28.22 L 0 28.22" class="primitive"/>
+            </g>
+            <g transform="translate(84.41,91.13)" id="img-850f8303-33" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-28.26 L 0 28.26" class="primitive"/>
+            </g>
+            <g transform="translate(136.73,90.74)" id="img-850f8303-34" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-28.79 L 0 28.79" class="primitive"/>
+            </g>
+            <g transform="translate(189.05,81.8)" id="img-850f8303-35" class="color_geometricflux" stroke="#0096D4">
+              <path fill="none" d="M0,-36.12 L 0 36.12" class="primitive"/>
+            </g>
+            <g transform="translate(32.1,82.08)" id="img-850f8303-36" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-8.56 L 0 8.56" class="primitive"/>
+            </g>
+            <g transform="translate(84.41,82.21)" id="img-850f8303-37" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-8.47 L 0 8.47" class="primitive"/>
+            </g>
+            <g transform="translate(136.73,74.67)" id="img-850f8303-38" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-15.85 L 0 15.85" class="primitive"/>
+            </g>
+            <g transform="translate(189.05,57.21)" id="img-850f8303-39" class="color_pytorch-scatter" stroke="#A8A200">
+              <path fill="none" d="M0,-33.02 L 0 33.02" class="primitive"/>
+            </g>
+            <g class="marker" id="img-850f8303-40">
+              <g transform="translate(32.1,119.44)" id="img-850f8303-41" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,119.39)" id="img-850f8303-42" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,119.53)" id="img-850f8303-43" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,117.92)" id="img-850f8303-44" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(32.1,90.64)" id="img-850f8303-45" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,90.68)" id="img-850f8303-46" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,90.52)" id="img-850f8303-47" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,90.23)" id="img-850f8303-48" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+            </g>
+            <g class="marker" id="img-850f8303-49">
+              <g transform="translate(32.1,63.01)" id="img-850f8303-50" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,62.87)" id="img-850f8303-51" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,61.95)" id="img-850f8303-52" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,45.68)" id="img-850f8303-53" stroke="#0096D4">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(32.1,73.51)" id="img-850f8303-54" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(84.41,73.74)" id="img-850f8303-55" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(136.73,58.83)" id="img-850f8303-56" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+              <g transform="translate(189.05,24.19)" id="img-850f8303-57" stroke="#A8A200">
+                <path fill="none" d="M-1.5,0 L 1.5 0" class="primitive"/>
+              </g>
+            </g>
+          </g>
+        </g>
+        <g stroke-width="0.3" fill="#000000" fill-opacity="0.000" class="geometry" id="img-850f8303-58">
+          <g transform="translate(110.57,89.14)" id="img-850f8303-59" class="color_geometricflux" stroke-dasharray="none" stroke="#00BFFF">
+            <path fill="none" d="M-78.48,29.13 L -26.16 21.54 26.16 -8.06 78.48 -42.6" class="primitive"/>
+          </g>
+          <g transform="translate(110.57,66.51)" id="img-850f8303-60" class="color_pytorch-scatter" stroke-dasharray="none" stroke="#D4CA3A">
+            <path fill="none" d="M-78.48,23.67 L -26.16 23.44 26.16 -5.25 78.48 -41.86" class="primitive"/>
+          </g>
+        </g>
+        <g class="geometry" id="img-850f8303-61">
+          <g stroke-width="0.3" id="img-850f8303-62">
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-850f8303-63">
+              <g class="marker" id="img-850f8303-64">
+                <g transform="translate(189.05,24.65)" id="img-850f8303-65">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-850f8303-66">
+              <g class="marker" id="img-850f8303-67">
+                <g transform="translate(136.73,61.26)" id="img-850f8303-68">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-850f8303-69">
+              <g class="marker" id="img-850f8303-70">
+                <g transform="translate(84.41,89.95)" id="img-850f8303-71">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_pytorch-scatter" stroke="#FFFFFF" fill="#D4CA3A" id="img-850f8303-72">
+              <g class="marker" id="img-850f8303-73">
+                <g transform="translate(32.1,90.18)" id="img-850f8303-74">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-850f8303-75">
+              <g class="marker" id="img-850f8303-76">
+                <g transform="translate(189.05,46.54)" id="img-850f8303-77">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-850f8303-78">
+              <g class="marker" id="img-850f8303-79">
+                <g transform="translate(136.73,81.09)" id="img-850f8303-80">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-850f8303-81">
+              <g class="marker" id="img-850f8303-82">
+                <g transform="translate(84.41,110.68)" id="img-850f8303-83">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+            <g class="color_geometricflux" stroke="#FFFFFF" fill="#00BFFF" id="img-850f8303-84">
+              <g class="marker" id="img-850f8303-85">
+                <g transform="translate(32.1,118.27)" id="img-850f8303-86">
+                  <circle cx="0" cy="0" r="0.9" class="primitive"/>
+                </g>
+              </g>
+            </g>
+          </g>
+        </g>
+      </g>
+    </g>
+  </g>
+  <g class="guide ylabels" font-size="2.82" font-family="'PT Sans Caption','Helvetica Neue','Helvetica',sans-serif" fill="#6C606B" id="img-850f8303-87">
+    <g transform="translate(18.63,129.78)" id="img-850f8303-88">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">0</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,106.34)" id="img-850f8303-89">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">1</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,82.91)" id="img-850f8303-90">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">2</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,59.48)" id="img-850f8303-91">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">3</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,36.04)" id="img-850f8303-92">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">4</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+    <g transform="translate(18.63,12.61)" id="img-850f8303-93">
+      <g class="primitive">
+        <text text-anchor="end" dy="0.35em">10<tspan style="dominant-baseline:inherit" dy="-0.6em" font-size="83%">5</tspan><tspan dy="0.498000em"></tspan></text>
+      </g>
+    </g>
+  </g>
+  <g font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" fill="#564A55" stroke="#000000" stroke-opacity="0.000" id="img-850f8303-94">
+    <g transform="translate(8.81,69.19)" id="img-850f8303-95">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.35em" transform="rotate(-90,0, 2)">Time (μs)</text>
+      </g>
+    </g>
+  </g>
+  <g font-size="3.88" font-family="'PT Sans','Helvetica Neue','Helvetica',sans-serif" fill="#564A55" stroke="#000000" stroke-opacity="0.000" id="img-850f8303-96">
+    <g transform="translate(110.57,5)" id="img-850f8303-97">
+      <g class="primitive">
+        <text text-anchor="middle" dy="0.6em">Scatter add performance on GPU</text>
+      </g>
+    </g>
+  </g>
+</g>
+<defs>
+  <clipPath id="img-850f8303-13">
+    <path d="M19.63,10.61 L 201.51 10.61 201.51 131.78 19.63 131.78" />
+  </clipPath>
+</defs>
+</svg>
diff --git a/benchmark/scatter.jl b/benchmark/scatter.jl
new file mode 100644
index 000000000..4b5ad56ce
--- /dev/null
+++ b/benchmark/scatter.jl
@@ -0,0 +1,67 @@
+using CUDAdrv
+using CUDAnative
+using CuArrays
+using GeometricFlux
+using DataFrames
+using CSV
+using BenchmarkTools
+using BenchmarkTools: Trial, TrialEstimate, median, mean
+# using ProfileView
+
+d = 50
+nbins = 20
+getinfo(te::TrialEstimate) = te.time, te.gctime, te.memory
+getstats(t::Trial) = [getinfo(minimum(t)), getinfo(median(t)), getinfo(mean(t)),
+                      getinfo(maximum(t))]
+
+metadata = DataFrame(device=String[], dim=Int[], sample=Int[], bins=Int[])
+mintime = DataFrame(min_time=Float64[], min_gc=Float64[], min_mem=Int[])
+medtime = DataFrame(med_time=Float64[], med_gc=Float64[], med_mem=Int[])
+meantime = DataFrame(mean_time=Float64[], mean_gc=Float64[], mean_mem=Int[])
+maxtime = DataFrame(max_time=Float64[], max_gc=Float64[], max_mem=Int[])
+
+for l = [2^5, 2^10, 2^15, 2^20]
+    hist = zeros(Float32, d, nbins)
+    δ = rand(Float32, d, l)
+    idx = rand(1:nbins, l)
+
+    hist_gpu = CuArray(hist)
+    δ_gpu = CuArray(δ)
+    idx_gpu = CuArray(idx)
+
+    scatter_add!(hist, δ, idx)
+    scatter_add!(hist_gpu, δ_gpu, idx_gpu)
+
+    b_cpu = @benchmark scatter_add!($hist, $δ, $idx)
+    b_gpu = @benchmark scatter_add!($hist_gpu, $δ_gpu, $idx_gpu)
+    s_cpu = getstats(b_cpu)
+    s_gpu = getstats(b_gpu)
+
+    push!(metadata, ("cpu", d, l, nbins))
+    push!(mintime, s_cpu[1])
+    push!(medtime, s_cpu[2])
+    push!(meantime, s_cpu[3])
+    push!(maxtime, s_cpu[4])
+
+    push!(metadata, ("gpu", d, l, nbins))
+    push!(mintime, s_gpu[1])
+    push!(medtime, s_gpu[2])
+    push!(meantime, s_gpu[3])
+    push!(maxtime, s_gpu[4])
+end
+
+data = hcat(metadata, mintime, medtime, meantime, maxtime)
+CSV.write("benchmark_scatter_julia.tsv", data; delim="\t")
+
+
+## Benchmark
+# @benchmark scatter_add!($hist, $δ, $idx)
+# CuArrays.@time scatter_add!(hist_gpu, δ_gpu, idx_gpu)
+
+## Profiling
+# sudo nvprof --profile-from-start off julia-1.3 benchmarks/scatter.jl
+# sudo nvprof --profile-from-start off --print-gpu-trace julia-1.3 --proj benchmarks/scatter.jl
+# sudo chown yuehhua -R /home/yuehhua/.julia/
+
+# @profview scatter_add!(hist, δ, idx)
+# CUDAdrv.@profile scatter_add!(hist_gpu, δ_gpu, idx_gpu)
diff --git a/benchmark/scatter_py.jl b/benchmark/scatter_py.jl
new file mode 100644
index 000000000..9bc7b638d
--- /dev/null
+++ b/benchmark/scatter_py.jl
@@ -0,0 +1,61 @@
+using PyCall
+using DataFrames
+using CSV
+using BenchmarkTools
+using BenchmarkTools: Trial, TrialEstimate, median, mean
+
+py"""
+import torch
+import torch_scatter as sc
+torch.set_num_threads(12)
+cuda = torch.device("cuda:0")
+d = 50
+nbins = 20
+"""
+
+d = 50
+nbins = 20
+getinfo(te::TrialEstimate) = te.time, te.gctime, te.memory
+getstats(t::Trial) = [getinfo(minimum(t)), getinfo(median(t)), getinfo(mean(t)),
+                      getinfo(maximum(t))]
+
+metadata = DataFrame(device=String[], dim=Int[], sample=Int[], bins=Int[])
+mintime = DataFrame(min_time=Float64[], min_gc=Float64[], min_mem=Int[])
+medtime = DataFrame(med_time=Float64[], med_gc=Float64[], med_mem=Int[])
+meantime = DataFrame(mean_time=Float64[], mean_gc=Float64[], mean_mem=Int[])
+maxtime = DataFrame(max_time=Float64[], max_gc=Float64[], max_mem=Int[])
+
+for l = [2^5, 2^10, 2^15, 2^20]
+    py"""
+    hist = torch.zeros([d, nbins], dtype=torch.float32)
+    delta = torch.rand([d, $(l)], dtype=torch.float32)
+    idx = torch.randint(0, nbins, size=($(l),))
+
+    hist_gpu = torch.zeros([d, nbins], dtype=torch.float32, device=cuda)
+    delta_gpu = torch.rand([d, $(l)], dtype=torch.float32, device=cuda)
+    idx_gpu = torch.randint(0, nbins, size=($(l),), device=cuda)
+
+    sc.scatter_add(delta, idx, out=hist)
+    sc.scatter_add(delta_gpu, idx_gpu, out=hist_gpu)
+    """
+
+    b_cpu = @benchmark py"sc.scatter_add(delta, idx, out=hist)";
+    b_gpu = @benchmark py"sc.scatter_add(delta_gpu, idx_gpu, out=hist_gpu)";
+    s_cpu = getstats(b_cpu)
+    s_gpu = getstats(b_gpu)
+
+    push!(metadata, ("cpu", d, l, nbins))
+    push!(mintime, s_cpu[1])
+    push!(medtime, s_cpu[2])
+    push!(meantime, s_cpu[3])
+    push!(maxtime, s_cpu[4])
+
+    push!(metadata, ("gpu", d, l, nbins))
+    push!(mintime, s_gpu[1])
+    push!(medtime, s_gpu[2])
+    push!(meantime, s_gpu[3])
+    push!(maxtime, s_gpu[4])
+end
+
+data = hcat(metadata, mintime, medtime, meantime, maxtime)
+CSV.write("benchmark_scatter_pytorch.tsv", data; delim="\t")