A number of GPU coaching in PyTorch and Gradient Accumulation as a substitute for it | by Alexey Kravets

import os
os.environ[“CUDA_VISIBLE_DEVICES”] = “0,1”
print(os.environ[“CUDA_VISIBLE_DEVICES”])

import torch
import torch.nn as nn
from torch.utils.information import DataLoader, Dataset, Sampler
import argparse
import torch.optim as optim
import numpy as np
import random
import torch.backends.cudnn as cudnn
import torch.nn.useful as F

from torch.distributed import init_process_group
import torch.distributed as dist

class data_set(Dataset):

def __init__(self, df):
self.df = df

def __len__(self):
return len(self.df)

def __getitem__(self, index):

pattern = self.df[index]
return index, pattern

class NeuralNetwork(nn.Module):
def __init__(self, dsize):
tremendous().__init__()
self.linear = nn.Linear(dsize, 1, bias=False)
self.linear.weight.information[:] = 1.

def ahead(self, x):
x = self.linear(x)
loss = x.sum()
return loss

class DummySampler(Sampler):
def __init__(self, information, batch_size, n_gpus=2):
self.num_samples = len(information)
self.b_size = batch_size
self.n_gpus = n_gpus

def __iter__(self):
ids = []
for i in vary(0, self.num_samples, self.b_size * self.n_gpus):
ids.append(np.arange(self.num_samples)[i: i + self.b_size*self.n_gpus :self.n_gpus])
ids.append(np.arange(self.num_samples)[i+1: (i+1) + self.b_size*self.n_gpus :self.n_gpus])
return iter(np.concatenate(ids))

def __len__(self):
# print (‘tcalling Sampler:__len__’)
return self.num_samples

def major(args=None):

d_size = args.data_size

if args.distributed:
init_process_group(backend=”nccl”)
gadget = int(os.environ[“LOCAL_RANK”])
torch.cuda.set_device(gadget)
else:
gadget = “cuda:0”

# repair the seed for reproducibility
seed = args.seed

torch.manual_seed(seed)
np.random.seed(seed)
random.seed(seed)
cudnn.benchmark = True

# generate information
information = torch.rand(d_size, d_size)

mannequin = NeuralNetwork(args.data_size)
mannequin = mannequin.to(gadget)

if args.distributed:
mannequin = torch.nn.parallel.DistributedDataParallel(mannequin, device_ids=[device])

optimizer = optim.SGD(mannequin.parameters(), lr=0.01, momentum=0.9)
dataset = data_set(information)

if args.distributed:
sampler = torch.utils.information.DistributedSampler(dataset, shuffle=False)
else:
# we outline `DummySampler` for precise reproducibility with `DistributedSampler`
# which splits the information as described within the article.
sampler = DummySampler(dataset, args.batch_size)

loader = DataLoader(
dataset,
batch_size=args.batch_size,
num_workers=0,
pin_memory=True,
sampler=sampler,
shuffle=False,
collate_fn=None,
)

if not args.distributed:
grads = []

# ACC_STEPS identical as GPU as we have to divide the loss by this quantity
# to acquire the identical gradient as from a number of GPUs which are
# averaged collectively
ACC_STEPS = args.acc_steps
optimizer.zero_grad()

for epoch in vary(args.epochs):

if args.distributed:
loader.sampler.set_epoch(epoch)

for i, (idxs, row) in enumerate(loader):

if args.distributed:
optimizer.zero_grad()

row = row.to(gadget, non_blocking=True)

if args.distributed:
rank = dist.get_rank() == 0
else:
rank = True

loss = mannequin(row)

if args.distributed:
# does common gradients routinely due to mannequin wrapper into
# `DistributedDataParallel`
loss.backward()
else:
# scale loss based on accumulation steps
loss = loss/ACC_STEPS
loss.backward()

if i == 0 and rank:
print(f”Epoch {epoch} {100 * ‘=’}”)

if not args.distributed:
if (i + 1) % ACC_STEPS == 0: # solely step when we now have finished ACC_STEPS
# acumulate grads for whole epoch
optimizer.step()
optimizer.zero_grad()
else:
optimizer.step()

if not args.distributed and args.verbose:
print(100 * “=”)
print(“Mannequin weights : “, mannequin.linear.weight)
print(100 * “=”)
elif args.distributed and args.verbose and rank:
print(100 * “=”)
print(“Mannequin weights : “, mannequin.module.linear.weight)
print(100 * “=”)

if __name__ == “__main__”:

parser = argparse.ArgumentParser()
parser.add_argument(‘–distributed’, motion=’store_true’,)
parser.add_argument(‘–seed’, default=0, sort=int)
parser.add_argument(‘–epochs’, default=2, sort=int)
parser.add_argument(‘–batch_size’, default=4, sort=int)
parser.add_argument(‘–data_size’, default=16, sort=int)
parser.add_argument(‘–acc_steps’, default=3, sort=int)
parser.add_argument(‘–verbose’, motion=’store_true’,)

args = parser.parse_args()

print(args)

major(args)

A number of GPU coaching in PyTorch and Gradient Accumulation as a substitute for it | by Alexey Kravets | Jul, 2023

New Technology Revolutionizes Insect Research

Open Source AI Has Founders—and the FTC—Buzzing

You Don't Understand AI Until You Watch THIS

Think Deepfakes Aren’t a Risk? Check Out This AI Video of Biden Flinging Slurs at His Enemies

Leak Shows That Google-Funded AI Video Generator Runway Was Trained on Stolen YouTube Content, Pirated Films

Study Finds That AI Is Adding to Employees’ Workload and Burning Them Out

New Technology Revolutionizes Insect Research

Open Source AI Has Founders—and the FTC—Buzzing

Think Deepfakes Aren’t a Risk? Check Out This AI Video of Biden Flinging Slurs at His Enemies

Leak Shows That Google-Funded AI Video Generator Runway Was Trained on Stolen YouTube Content, Pirated Films

Study Finds That AI Is Adding to Employees’ Workload and Burning Them Out

When AI Is Trained With AI-Generated Data, It Starts Spouting Gibberish

Bind AI Copilot (www.getbind.co)

Forensic Analysis Finds Overwhelming Similarities Between OpenAI’s Voice and Scarlett Johansson

WriteText.ai for WooCommerce (writetext.ai)

World’s Largest Radiology AI Marketplace CARPL Raises $6 Million to Accelerate the Adoption of AI in Clinical Workflows

Google for Startups Accelerator: AI First MENA-T

3 Methods To Overcome Knowledge High quality Challenges in an Analytics Venture | by Hanzala Qureshi | Jul, 2023

How Patsnap used GPT-2 inference on Amazon SageMaker with low latency and price

Log In

With social network:

Or with username:

Sign In

Forgot password?

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections