Weird Reported Memory Usage #26

Closed

Closed

Weird Reported Memory Usage#26

opened

I notice in current report

	Training (with int8)
Baize-7B	26GB
Baize-13B	25GB
Baize-30B	42GB

13B models consumes actually less memory than 7B. Is it a typo?

Metadata

Assignees

No one assigned

Labels

No labels

No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests