machine learning models and verbatim data output

To: debian-ai <debian-ai@lists.debian.org>
Subject: machine learning models and verbatim data output
From: Paul Wise <pabs@debian.org>
Date: Mon, 28 Dec 2020 15:17:03 +0800
Message-id: <[🔎] 0f58d8b59676f5709c9dd30838b168913c1e48c5.camel@debian.org>
Reply-to: debian-ai <debian-ai@lists.debian.org>, Paul Wise <pabs@debian.org>

Hi all,

This study about the GPT-2 and GPT-3 machine learning models outputting
data verbatim from the training data set has interesting copyright,
licensing, source and privacy implications that could be interesting to
take into account for the Debian machine learning policy:

https://bair.berkeley.edu/blog/2020/12/20/lmmem/
https://news.ycombinator.com/item?id=25542011

PS: please CC me on any replies that you would like me to read.

-- 
bye,
pabs

https://wiki.debian.org/PaulWise

Attachment: signature.asc
Description: This is a digitally signed message part

Reply to:

Prev by Date: pytorch_1.7.1-3_source.changes ACCEPTED into unstable
Next by Date: Re: cuda support of src:pytorch
Previous by thread: pytorch_1.7.1-3_source.changes ACCEPTED into unstable
Next by thread: Processing of onednn_2.0+ds-2~0exp0simde_source.changes
Index(es):
- Date
- Thread