Untitled

From Tacky Wolf, 6 Years ago, written in Plain Text.

Embed

Download Paste or View Raw
Hits: 259

// classic.cpp : "Textbook" implementation of matrix multiply

// Author: Paul J. Drongowski

// Address: Boston Design Center

// Advanced Micro Devices, Inc.

// Boxborough, MA 01719

// Date: 20 October 2005

//

// Copyright (c) 2005 Advanced Micro Devices, Inc.

// Celem tego programu jest prezentacja pomiaru i analizy

//efektywnosci programu za pomocą CodeAnalyst(tm).

// Implementacja mnożenia macierzy jest realizowana za pomoca typowego

// algorytmu podręcznikowego.

// Efektywność tego podejscia jest niska poprzez

// nieefektywną kolejnosć odwołań do elementów macierzy.

#include <stdio.h>

#include <time.h>

#include <windows.h>

#include "omp.h"

#define USE_MULTIPLE_THREADS true

#define MAXTHREADS 128

int NumThreads;

double start;

static const int ROWS = 1000; // liczba wierszy macierzy

static const int COLUMNS = 1000; // lizba kolumn macierzy

float matrix_a[ROWS][COLUMNS]; // lewy operand

float matrix_b[ROWS][COLUMNS]; // prawy operand

float matrix_r[ROWS][COLUMNS]; // wynik

FILE *result_file;

void initialize_matrices()

{

// zdefiniowanie zawarosci poczatkowej macierzy

#pragma omp parallel for

for (int i = 0; i < ROWS; i++) {

for (int j = 0; j < COLUMNS; j++) {

matrix_a[i][j] = (float)rand() / RAND_MAX;

matrix_b[i][j] = (float)rand() / RAND_MAX;

matrix_r[i][j] = 0.0;

}

}

}

void initialize_matricesZ()

{

// zdefiniowanie zawarosci poczatkowej macierzy

#pragma omp parallel for

for (int i = 0; i < ROWS; i++) {

for (int j = 0; j < COLUMNS; j++) {

matrix_r[i][j] = 0.0;

}

}

}

void print_result()

{

// wydruk wyniku

for (int i = 0; i < ROWS; i++) {

for (int j = 0; j < COLUMNS; j++) {

fprintf(result_file, "%6.4f ", matrix_r[i][j]);

}

fprintf(result_file, "n");

}

}

void multiply_matrices_IKJ()

{

for (int i = 0; i < ROWS; i++)

for (int k = 0; k < COLUMNS; k++)

for (int j = 0; j < COLUMNS; j++)

matrix_r[i][j] += matrix_a[i][k] * matrix_b[k][j];

}

void multiply_matrices_IKJ_ATOMIC()

{

#pragma omp parallel for

for (int i = 0; i < ROWS; i++)

for (int k = 0; k < COLUMNS; k++)

for (int j = 0; j < COLUMNS; j++)

matrix_r[i][j] += matrix_a[i][k] * matrix_b[k][j];

}

void multiply_matrices_IKJ_REDUCTION()

{

for (int i = 0; i < ROWS; i++)

for (int k = 0; k < COLUMNS; k++)

for (int j = 0; j < COLUMNS; j++)

matrix_r[i][j] += matrix_a[i][k] * matrix_b[k][j];

}

void print_elapsed_time()

{

double elapsed;

double resolution;

// wyznaczenie i zapisanie czasu przetwarzania

elapsed = (double)clock() / CLK_TCK;

resolution = 1.0 / CLK_TCK;

fprintf(result_file,

"Czas wykonania programu: %8.4f sec (%6.4f sec rozdzielczosc pomiaru)n",

elapsed - start, resolution);

}

int main(int argc, char* argv[])

{

// start = (double) clock() / CLK_TCK ;

if ((result_file = fopen("classic.txt", "w")) == NULL) {

fprintf(stderr, "nie mozna otworzyc pliku wyniku n");

perror("classic");

return(EXIT_FAILURE);

}

//Determine the number of threads to use

if (USE_MULTIPLE_THREADS) {

SYSTEM_INFO SysInfo;

GetSystemInfo(&SysInfo);

NumThreads = SysInfo.dwNumberOfProcessors;

if (NumThreads > MAXTHREADS)

NumThreads = MAXTHREADS;

}

else

NumThreads = 1;

fprintf(result_file, "Klasyczny algorytm mnozenia macierzy, liczba watkow %d n", NumThreads);

printf("liczba watkow = %dnn", NumThreads);

initialize_matricesZ();

start = (double)clock() / CLK_TCK;

multiply_matrices_IKJ();

print_elapsed_time();

initialize_matricesZ();

start = (double)clock() / CLK_TCK;

//multiply_matrices_JIK();

print_elapsed_time();

initialize_matricesZ();

start = (double)clock() / CLK_TCK;

//multiply_matrices_JKI();

print_elapsed_time();

fclose(result_file);

return(0);

}

Author

Title

Language

Your paste - Paste your paste here

// classic.cpp : &quot;Textbook&quot; implementation of matrix multiply

// Author:  Paul J. Drongowski
// Address: Boston Design Center
//          Advanced Micro Devices, Inc.
//          Boxborough, MA 01719
// Date:    20 October 2005
//
// Copyright (c) 2005 Advanced Micro Devices, Inc.

// Celem tego programu jest prezentacja pomiaru i analizy 
//efektywnosci programu za pomocą  CodeAnalyst(tm).
// Implementacja mnożenia macierzy jest realizowana za pomoca typowego 
// algorytmu podręcznikowego. 
//  Efektywność tego podejscia jest niska poprzez 
// nieefektywną  kolejnosć odwołań do elementów macierzy.
#include &lt;stdio.h&gt;
#include &lt;time.h&gt;
#include &lt;windows.h&gt;
#include &quot;omp.h&quot;

#define USE_MULTIPLE_THREADS true
#define MAXTHREADS 128
int NumThreads;
double start;

static const int ROWS = 1000;     // liczba wierszy macierzy
static const int COLUMNS = 1000;  // lizba kolumn macierzy

float matrix_a[ROWS][COLUMNS];    // lewy operand 
float matrix_b[ROWS][COLUMNS];    // prawy operand
float matrix_r[ROWS][COLUMNS];    // wynik

FILE *result_file;

void initialize_matrices()
{
	// zdefiniowanie zawarosci poczatkowej macierzy
#pragma omp parallel for 
	for (int i = 0; i &lt; ROWS; i++) {
		for (int j = 0; j &lt; COLUMNS; j++) {
			matrix_a[i][j] = (float)rand() / RAND_MAX;
			matrix_b[i][j] = (float)rand() / RAND_MAX;
			matrix_r[i][j] = 0.0;
		}
	}
}

void initialize_matricesZ()
{
	// zdefiniowanie zawarosci poczatkowej macierzy
#pragma omp parallel for 
	for (int i = 0; i &lt; ROWS; i++) {
		for (int j = 0; j &lt; COLUMNS; j++) {
			matrix_r[i][j] = 0.0;
		}
	}
}
void print_result()
{
	// wydruk wyniku
	for (int i = 0; i &lt; ROWS; i++) {
		for (int j = 0; j &lt; COLUMNS; j++) {
			fprintf(result_file, &quot;%6.4f &quot;, matrix_r[i][j]);
		}
		fprintf(result_file, &quot;n&quot;);
	}
}

void multiply_matrices_IKJ()
{
	for (int i = 0; i &lt; ROWS; i++)
		for (int k = 0; k &lt; COLUMNS; k++)
			for (int j = 0; j &lt; COLUMNS; j++)
				matrix_r[i][j] += matrix_a[i][k] * matrix_b[k][j];

}

void multiply_matrices_IKJ_ATOMIC()
{
#pragma omp parallel for
	for (int i = 0; i &lt; ROWS; i++)
		for (int k = 0; k &lt; COLUMNS; k++)
			for (int j = 0; j &lt; COLUMNS; j++)
				matrix_r[i][j] += matrix_a[i][k] * matrix_b[k][j];

}

void multiply_matrices_IKJ_REDUCTION()
{

for (int i = 0; i &lt; ROWS; i++)
		for (int k = 0; k &lt; COLUMNS; k++)
			for (int j = 0; j &lt; COLUMNS; j++)
				matrix_r[i][j] += matrix_a[i][k] * matrix_b[k][j];

}

void print_elapsed_time()
{
	double elapsed;
	double resolution;

// wyznaczenie i zapisanie czasu przetwarzania
	elapsed = (double)clock() / CLK_TCK;
	resolution = 1.0 / CLK_TCK;

fprintf(result_file,
		&quot;Czas wykonania programu: %8.4f sec (%6.4f sec rozdzielczosc pomiaru)n&quot;,
		elapsed - start, resolution);
}

int main(int argc, char* argv[])
{
	//	 start = (double) clock() / CLK_TCK ;
	if ((result_file = fopen(&quot;classic.txt&quot;, &quot;w&quot;)) == NULL) {
		fprintf(stderr, &quot;nie mozna otworzyc pliku wyniku n&quot;);
		perror(&quot;classic&quot;);
		return(EXIT_FAILURE);
	}

//Determine the number of threads to use
	if (USE_MULTIPLE_THREADS) {
		SYSTEM_INFO SysInfo;
		GetSystemInfo(&amp;SysInfo);
		NumThreads = SysInfo.dwNumberOfProcessors;
		if (NumThreads &gt; MAXTHREADS)
			NumThreads = MAXTHREADS;
	}
	else
		NumThreads = 1;
	fprintf(result_file, &quot;Klasyczny algorytm mnozenia macierzy, liczba watkow %d n&quot;, NumThreads);
	printf(&quot;liczba watkow  = %dnn&quot;, NumThreads);

initialize_matricesZ();
	start = (double)clock() / CLK_TCK;
	multiply_matrices_IKJ();
	print_elapsed_time();

initialize_matricesZ();
	start = (double)clock() / CLK_TCK;
	//multiply_matrices_JIK();
	print_elapsed_time();

initialize_matricesZ();
	start = (double)clock() / CLK_TCK;
	//multiply_matrices_JKI();
	print_elapsed_time();

fclose(result_file);

return(0);
}

Private - Private paste aren't shown in recent listings.

Delete After - When should we delete your paste?

Spam protection -

{"html5":"htmlmixed","css":"css","javascript":"javascript","php":"php","python":"python","ruby":"ruby","lua":"text\/x-lua","bash":"text\/x-sh","go":"go","c":"text\/x-csrc","cpp":"text\/x-c++src","diff":"diff","latex":"stex","sql":"sql","xml":"xml","apl":"apl","asterisk":"asterisk","c_loadrunner":"text\/x-csrc","c_mac":"text\/x-csrc","coffeescript":"text\/x-coffeescript","csharp":"text\/x-csharp","d":"d","ecmascript":"javascript","erlang":"erlang","groovy":"text\/x-groovy","haskell":"text\/x-haskell","haxe":"text\/x-haxe","html4strict":"htmlmixed","java":"text\/x-java","java5":"text\/x-java","jquery":"javascript","mirc":"mirc","mysql":"sql","ocaml":"text\/x-ocaml","pascal":"text\/x-pascal","perl":"perl","perl6":"perl","plsql":"sql","properties":"text\/x-properties","q":"text\/x-q","scala":"scala","scheme":"text\/x-scheme","tcl":"text\/x-tcl","vb":"text\/x-vb","verilog":"text\/x-verilog","yaml":"text\/x-yaml","z80":"text\/x-z80"}

Reply to "Untitled"